Mesin pencari atau Search engine adalah program komputer yang dirancang untuk melakukan pencarian atas berkas-berkas yang tersimpan dalam layanan www, ftp, publikasi milis, ataupun news group dalam sebuah ataupun sejumlah komputer peladendalam suatu jaringan. Search engine merupakan perangkat pencari informasi dari dokumen-dokumen yang tersedia. Hasil pencarian umumnya ditampilkan dalam bentuk daftar yang seringkali diurutkan menurut tingkat akurasi ataupun rasio pengunjung atas suatu berkas yang disebut sebagai hits. Informasi yang menjadi target pencarian bisa terdapat dalam berbagai macam jenis berkas seperti halaman situs web, gambar, ataupun jenis-jenis berkas lainnya.
Cara kerja mesin pencari
Mesin pencari web bekerja dengan
cara menyimpan informasi tentang banyak halaman web, yang diambil langsung
dari WWW. Halaman-halaman ini diambil dengan web crawler — browser web
otomatis yang mengikuti setiap pranala/link yang dilihatnya. Isi setiap halaman
lalu dianalisis untuk menentukan cara indeks-nya (misalnya, kata-kata diambil
dari judul, subjudul, atau field khusus yang disebut meta
tag). Data tentang halaman web disimpan dalam sebuah database indeks
untuk digunakan dalam pencarian selanjutnya. Sebagian mesin pencari,
seperti Google, menyimpan seluruh atau sebagian halaman
sumber (yang disebut cache) maupun informasi tentang halaman web itu
sendiri.
Selain halaman web, Mesin
pencari juga menyimpan dan memberikan informasi hasil pencarian berupa pranala
yang merujuk pada file, seperti file audio, file video,
gambar, foto dan sebagainya, serta informasi tentang
seseorang, suatu produk, layanan, dan informasi beragam lainnya yang semakin
terus berkembang sesuai dengan perkembangan teknologi informasi.
Ketika seseorang mengunjungi mesin
pencari dan memasukkan query, biasanya dengan memasukkan kata
kunci, mesin mencari indeks dan memberikan daftar halaman web yang paling
sesuai dengan kriterianya, biasanya disertai ringkasan singkat mengenai judul
dokumen dan kadang-kadang sebagian teksnya.
Ada jenis mesin pencari lain: mesin
pencari real-time, seperti Orase. Mesin seperti ini tidak
menggunakan indeks. Informasi yang diperlukan mesin tersebut hanya dikumpulkan
jika ada pencarian baru. Jika dibandingkan dengan sistem berbasis indeks yang
digunakan mesin-mesin seperti Google, sistem real-time ini
unggul dalam beberapa hal: informasi selalu mutakhir, (hampir) tak ada pranala
mati, dan lebih sedikit sumber daya sistem yang diperlukan. (Google menggunakan
hampir 100.000 komputer, Orase hanya satu.) Tetapi, ada juga kelemahannya:
pencarian lebih lama rampungnya.
Manfaat mesin pencari
bergantung pada relevansi hasil-hasil yang diberikannya. Meskipun
mungkin ada jutaan halaman web yang mengandung suatu kata atau frasa, sebagian halaman
mungkin lebih relevan, populer, atau autoritatif daripada yang lain. Kebanyakan
mesin pencari menggunakan berbagai metode untuk
menentukan peringkat hasil pencarian agar mampu memberikan hasil
“terbaik” lebih dahulu. Cara mesin menentukan halaman mana yang paling sesuai,
dan urutan halaman-halaman itu diperlihatkan, sangat bervariasi. Metode-metode
nya juga berubah seiring waktu dengan berubahnya penggunaan internet dan
berevolusinya teknik-teknik baru.
Sebagian besar mesin pencari web
adalah usaha komersial yang didukung pemasukan iklan dan karenanya
sebagian menjalankan praktik kontroversial, yaitu membolehkan pengiklan
membayar agar halaman mereka diberi peringkat lebih tinggi dalam hasil
pencarian.
Proses Pencarian
Melakukan pencarian dokumen yang
dimuat pada suatu situs bisa begitu mudah dan kelihatannya mungkin sulit juga.
apalagi mengignat begitu menyebarnya informasi dimana-mana, bahkan University
of Calofornia menyebutkan saat ini telah terdapat lebih dari 50 milyar halaman
web di internet, meskipun tidak ada ada satupun yang benar-benar tahu
jumlah persisnya.
kesulitan yang mungkin terjadi
adalah karena WWW tersebut tidak terdata dalam bentuk yang terstandardisasi
isinya. tidak sama halnya dengan katalog yang ada di perpustakaan, yang memiliki
standardisasi secara mendunia berdasarkan subjek dari judul buku, meskipun
jumlahnya juga tidak sedikit.
Dalam pencarian di web,
pengguna selalu memperkirakan kata apa yang di kira-kira terdapat pada halaman
yang ingin anda temukan. atau kira-kira apa subjek yang dipilih oleh seseorang
untuk mengelolah halaman situs yang mereka kelola, topik apa saja kira-kira
yang di bahas.
Jika pengguna melakukan apa yang
dikenal dengan pencarian pada halaman web, sebenarnya tidaklah melakukan
pencarian. tidak mungkin melakukan pencarian di WWW secara langsung.
Pada web benar-benar
terdiri dari banyak sekali halaman web yang ingin disimpan dari berbagai server
diseluruh dunia. Komputer pengguna tidak langsung melakukan pencarian
kepada seluruh komputer tersebut secara langsung.
Apa yang mungkin pengguna lakukan
hanyalah melalui komputer untuk mengakses satu atau lebih perantara yang
disebut dengan alat bantu pencarian yang ada saat ini. Melakukan pencarian pada
alat bantu itu tadi ke database yang dimiliki. data base tersebut mengkoleksi
situs-situs yang ditemukan dan simpan.
alat bantu pencarian ini menyediakan
hasil pencarian dalam bentuk hypertext link dengan URL menuju
halaman lainnya. ketika anda klik link ini, dan menuju ke alamat tersebut maka
dokumen, gambar, suara dan banyak lagi bentuk lainnya yang ada pada server tersebut
disediakan, sesuai dengan informasi yang terdapat di dalamnya. layanan ini bisa
menjangkau ke manapun di seluruh dunia.
Prinsip Umum dari Mesin
Pencari
Sistem kinerja mesin ini ada
beberapa hal yang perlu di perhatikan terutama keterkaitannya dengan masalah
arsitekrut dan mekanismenya.
Spider
Merupakan program yang men-download
halaman-halaman yang mereka temukan, mirip dengan browser. Perbedannya adalah
bahwa browser menapilkan secara langsung informasi yang ada (baik tekas,
gambar, dll). Untuk kepentingan manusia yang menggunakannya pada saat itu,
sedangkan spider tidak melakukan untuk menampilkan dalam bentuk yang terlihat
seperti itu, karena kepentingannya adalah untuk mesin, bukan untuk manusia,
spider pun dijalankan oleh mesin secara otomatis. Kepentingannya adalah untuk
mengambil halaman-halaman yang dikunjunginya untuk disimpan kedalam database
yang dimiliki oleh search engine.
Crawler
Merupakan program yang dimiliki
search engine untuk melacak dan menemukan link yang terdapat dari setiap
halaman yang ditemuinya. Tugasnya adalah untuk menentukan spoder harus pergi
kemana dan mengevaluasi link berdasarkan alamat yang ditentukan dari awal.
Crawler mengikuti link dan mencoba menemukan dokumen yang belum dikenal oleh
search engine.
Indexer
Komponen ini melakukan aktifitas
untuk menguraikan masing-masing halaman dan meneliti berbagai unsur, seperti
teks, headers, struktur atau fitur dari gaya penulisan,
tag HTML khusus, dll.
Database
Merupakan tempat standar untuk
menyimpan data-data dari halaman yang telah dikunjungi, di-download dan sudah
dianalisis. kadang kala disebut juga dengan index dari suatu search engine.
Result Engine
Mesin yang melakukan penggolongan
dan penentuan peringkat dari hasil pencarian pada search engine. Mesin ini
menentukan halaman mana yang menemui kriteria terbaik dari hasil pencarian
berdasarkan permintaan penggunanya, dan bagaimana bentuk penampulan yang akan
ditampilkan.
Proses ini dilaksanakan
berdasarkan algoritma perangkingan yang dimiliki oleh search engine
tersebut, mengikuti kaidah perangkingan hakaman yang dipergunakan oleh mereka
adalah hak mereka, para peneliti mempelajari sifat-sifat yang mereka gunakan,
terutama untuk meningkatkan pencarian yang dihasilkan oleh serach engine
tersebut.
Web Server
Merupakan komponen yang melayani
permintaan dan memberikan respon balik dari permintaan tersebut. Web Server ini
biasanya menghasilkan informasi atau dokumen dalam format HTML.
Pada halaman tersebut tersedia layanan untuk mengisikan kata kunci pencarian
yang diinginkan oleh usernya. Web Server ini juga bertanggung jawab dalam
menyampaikan hasil pencarian yang dikirimkan kepada komputer yang meminta
informasi.
1. Mesin Pencari Google
Cara Kerja Search Engine 1: Menjelajahi Dan Menyusun
Index
- Google mengawali proses kerjanya dengan
menjelajahi semua halaman yang ada di internet (saat ini ada lebih dari 60
Triliun halaman)
- Mesin Pencari ini mengirimkan robotnya untuk
mengunjungi semua halaman dengan cara mengikuti link dari suatu halaman ke
halaman lainnya. (pemilik situs bisa mencegah halaman-halamannya dimasuki
oleh robot mesin pencari dengan memasang robots.txt yang melarang semua
robot atau robot tertentu untuk masuk)
- Google mengurutkan semua halaman itu berdasarkan kontennya dan faktor-faktor lainnya, dan sesudah itu menyimpan rekamannya dalam index (pusat kumpulan data Google)
Cara Kerja Search Engine 2: Pencarian Dan Algoritma
- Saat anda mengetikkan sesuatu di kotak pencarian,
maka apa yang anda ketikkan itu akan terkirim dan diproses di sistem
- Mesin pencari akan bekerja mencari
petunjuk-petunjuk untuk memahami apa yang anda inginkan, dan di sini ada 6
proses:
- Ejaan, untuk menilai apakah ejaan anda sudah
benar, dan jika salah maka Google akan memberi saran
- Autocomplete, di mana Google memperkirakan apa
yang kira-kira dicari dengan berbagai variasi makna lainnya
- Sinonim, Google berusaha melihat dokumen-dokumen
lain yang mengandung kata-kata yang sinonim dengan pencarian anda
- Metode Pencarian, Google juga menyediakan data
lain dalam format tertentu seperti video, atau gambar yang berkaitan
dengan kata kunci tersebut
- Google Instant, yang berusaha menampilkan hasil
secepat mungkin kepada anda.
- Dari semua petunjuk yang dikumpulkan di atas
Google akan menarik data dari tempat penyimpanannya tadi yang kita sebut
index.
- Proses menampilkan data ini (ranking) harus
melalui algoritma Google:
- Kualitas Situs dan Halaman -- Algoritma Google
akan bekerja untuk mengenali seberapa terpercaya, bereputasi, dan
berotoritasnya suatu sumber dengan menggunakan beberapa parameter. Salah
satu di antara parameter itu adalah pagerank
- Kesegaran -- Google juga memandang penting untuk
mempertimbangkan informasi-informasi terbaru untuk ditampilkan dalam
hasil pencariannya
- Pencarian Aman -- Google sebisa mungkin
mengurangi hasil pencarian yang berkonten dewasa dari hasil pencarian
anda (kecuali anda memang mencari konten dewasa). Jadi kalau anda bukan
situs konten dewasa, tapi memasang iklan yang menuju situs yang
mengandung konten dewasa, maka kemungkinan anda untuk ranking akan
berkurang
- Konteks Pengguna -- Google juga akan melihat
posisi geografis kita dan cookie pada komputer untuk menentukan ranking
halaman yang ditampilkannya....
- Bahasa -- Google juga akan menggolongkan hasil
pencarian berdasarkan bahasa dan negara
- Konten Umum -- Ini seperti gambar, video,
berita, peta, dan lain-lain yang juga akan diikutsertakan dalam halaman
hasil pencarian.
- Semua proses di atas berlangsung dalam 1/8 detik sebelum dikirimkan ke layar anda.
2. Mesin Pencari Yahoo
Yahoo merupakan mesin pencari terbesar kedua setelah google menempatkan dirinya sebagai acuan bagi pengguna internet untuk mencari halaman berdasarkan kata kunci tertentu. Selain sebagai mesin pencari yahoo memiliki layanan yang cukup banyak dengan berbagai fitur dan keunggulan yang dimilikinya.
Pada saat melakukan pencarian di Yahoo, sebagai mesin pencari Yahoo langsung mencari dari miliaran jenis dokumen web yang tersebar dari berbagai situs. Yahoo! Search kemudian membuat keputusan dengan cara membaca dan melihat relevansi komparatif setiap dokumen untuk permintaan pencarian dari kata kunci yang anda cari/masukkan, setelah itu terlihat berbagai halaman web dari hasil pencarian, urutan pada hasil yang ditampilkan ini disebut sebagai peringkat. Dari urutan teratas peringkat 1 pada Page 1 merupakan yang terbaik diikuti peringkat yang lainnya.
Mesin pencari yahoo tidak memiliki kemampuan untuk mengajukan pertanyaan pada setiap halaman yang ditampilkan pada sang pembuat atau pemilik akan kepantasan dan keakuratan atau besarnya informasi yang di sampaikan. Pada mesin pencari Yahoo mengandalkan istilah pencarian dengan keyword yang dimasukkan untuk menafsirkan dan menentukan tujuan pencarian.
0 komentar:
Posting Komentar