Mesin pencari atau Search engine adalah program komputer yang dirancang untuk melakukan pencarian atas berkas-berkas yang tersimpan dalam layanan www, ftp, publikasi milis, ataupun news group dalam sebuah ataupun sejumlah komputer peladendalam suatu jaringan. Search engine merupakan perangkat pencari informasi dari dokumen-dokumen yang tersedia. Hasil pencarian umumnya ditampilkan dalam bentuk daftar yang seringkali diurutkan menurut tingkat akurasi ataupun rasio pengunjung atas suatu berkas yang disebut sebagai hits. Informasi yang menjadi target pencarian bisa terdapat dalam berbagai macam jenis berkas seperti halaman situs web, gambar, ataupun jenis-jenis berkas lainnya.
Cara kerja mesin pencari
Mesin pencari web bekerja dengan
cara menyimpan informasi tentang banyak halaman web, yang diambil langsung
dari WWW. Halaman-halaman ini diambil dengan web crawler — browser web
otomatis yang mengikuti setiap pranala/link yang dilihatnya. Isi setiap halaman
lalu dianalisis untuk menentukan cara indeks-nya (misalnya, kata-kata diambil
dari judul, subjudul, atau field khusus yang disebut meta
tag). Data tentang halaman web disimpan dalam sebuah database indeks
untuk digunakan dalam pencarian selanjutnya. Sebagian mesin pencari,
seperti Google, menyimpan seluruh atau sebagian halaman
sumber (yang disebut cache) maupun informasi tentang halaman web itu
sendiri.
Selain halaman web, Mesin
pencari juga menyimpan dan memberikan informasi hasil pencarian berupa pranala
yang merujuk pada file, seperti file audio, file video,
gambar, foto dan sebagainya, serta informasi tentang
seseorang, suatu produk, layanan, dan informasi beragam lainnya yang semakin
terus berkembang sesuai dengan perkembangan teknologi informasi.
Ketika seseorang mengunjungi mesin
pencari dan memasukkan query, biasanya dengan memasukkan kata
kunci, mesin mencari indeks dan memberikan daftar halaman web yang paling
sesuai dengan kriterianya, biasanya disertai ringkasan singkat mengenai judul
dokumen dan kadang-kadang sebagian teksnya.
Ada jenis mesin pencari lain: mesin
pencari real-time, seperti Orase. Mesin seperti ini tidak
menggunakan indeks. Informasi yang diperlukan mesin tersebut hanya dikumpulkan
jika ada pencarian baru. Jika dibandingkan dengan sistem berbasis indeks yang
digunakan mesin-mesin seperti Google, sistem real-time ini
unggul dalam beberapa hal: informasi selalu mutakhir, (hampir) tak ada pranala
mati, dan lebih sedikit sumber daya sistem yang diperlukan. (Google menggunakan
hampir 100.000 komputer, Orase hanya satu.) Tetapi, ada juga kelemahannya:
pencarian lebih lama rampungnya.
Manfaat mesin pencari
bergantung pada relevansi hasil-hasil yang diberikannya. Meskipun
mungkin ada jutaan halaman web yang mengandung suatu kata atau frasa, sebagian halaman
mungkin lebih relevan, populer, atau autoritatif daripada yang lain. Kebanyakan
mesin pencari menggunakan berbagai metode untuk
menentukan peringkat hasil pencarian agar mampu memberikan hasil
“terbaik” lebih dahulu. Cara mesin menentukan halaman mana yang paling sesuai,
dan urutan halaman-halaman itu diperlihatkan, sangat bervariasi. Metode-metode
nya juga berubah seiring waktu dengan berubahnya penggunaan internet dan
berevolusinya teknik-teknik baru.
Sebagian besar mesin pencari web
adalah usaha komersial yang didukung pemasukan iklan dan karenanya
sebagian menjalankan praktik kontroversial, yaitu membolehkan pengiklan
membayar agar halaman mereka diberi peringkat lebih tinggi dalam hasil
pencarian.
Proses Pencarian
Melakukan pencarian dokumen yang
dimuat pada suatu situs bisa begitu mudah dan kelihatannya mungkin sulit juga.
apalagi mengignat begitu menyebarnya informasi dimana-mana, bahkan University
of Calofornia menyebutkan saat ini telah terdapat lebih dari 50 milyar halaman
web di internet, meskipun tidak ada ada satupun yang benar-benar tahu
jumlah persisnya.
kesulitan yang mungkin terjadi
adalah karena WWW tersebut tidak terdata dalam bentuk yang terstandardisasi
isinya. tidak sama halnya dengan katalog yang ada di perpustakaan, yang memiliki
standardisasi secara mendunia berdasarkan subjek dari judul buku, meskipun
jumlahnya juga tidak sedikit.
Dalam pencarian di web,
pengguna selalu memperkirakan kata apa yang di kira-kira terdapat pada halaman
yang ingin anda temukan. atau kira-kira apa subjek yang dipilih oleh seseorang
untuk mengelolah halaman situs yang mereka kelola, topik apa saja kira-kira
yang di bahas.
Jika pengguna melakukan apa yang
dikenal dengan pencarian pada halaman web, sebenarnya tidaklah melakukan
pencarian. tidak mungkin melakukan pencarian di WWW secara langsung.
Pada web benar-benar
terdiri dari banyak sekali halaman web yang ingin disimpan dari berbagai server
diseluruh dunia. Komputer pengguna tidak langsung melakukan pencarian
kepada seluruh komputer tersebut secara langsung.
Apa yang mungkin pengguna lakukan
hanyalah melalui komputer untuk mengakses satu atau lebih perantara yang
disebut dengan alat bantu pencarian yang ada saat ini. Melakukan pencarian pada
alat bantu itu tadi ke database yang dimiliki. data base tersebut mengkoleksi
situs-situs yang ditemukan dan simpan.
alat bantu pencarian ini menyediakan
hasil pencarian dalam bentuk hypertext link dengan URL menuju
halaman lainnya. ketika anda klik link ini, dan menuju ke alamat tersebut maka
dokumen, gambar, suara dan banyak lagi bentuk lainnya yang ada pada server tersebut
disediakan, sesuai dengan informasi yang terdapat di dalamnya. layanan ini bisa
menjangkau ke manapun di seluruh dunia.
Prinsip Umum dari Mesin
Pencari
Sistem kinerja mesin ini ada
beberapa hal yang perlu di perhatikan terutama keterkaitannya dengan masalah
arsitekrut dan mekanismenya.
Spider
Merupakan program yang men-download
halaman-halaman yang mereka temukan, mirip dengan browser. Perbedannya adalah
bahwa browser menapilkan secara langsung informasi yang ada (baik tekas,
gambar, dll). Untuk kepentingan manusia yang menggunakannya pada saat itu,
sedangkan spider tidak melakukan untuk menampilkan dalam bentuk yang terlihat
seperti itu, karena kepentingannya adalah untuk mesin, bukan untuk manusia,
spider pun dijalankan oleh mesin secara otomatis. Kepentingannya adalah untuk
mengambil halaman-halaman yang dikunjunginya untuk disimpan kedalam database
yang dimiliki oleh search engine.
Crawler
Merupakan program yang dimiliki
search engine untuk melacak dan menemukan link yang terdapat dari setiap
halaman yang ditemuinya. Tugasnya adalah untuk menentukan spoder harus pergi
kemana dan mengevaluasi link berdasarkan alamat yang ditentukan dari awal.
Crawler mengikuti link dan mencoba menemukan dokumen yang belum dikenal oleh
search engine.
Indexer
Komponen ini melakukan aktifitas
untuk menguraikan masing-masing halaman dan meneliti berbagai unsur, seperti
teks, headers, struktur atau fitur dari gaya penulisan,
tag HTML khusus, dll.
Database
Merupakan tempat standar untuk
menyimpan data-data dari halaman yang telah dikunjungi, di-download dan sudah
dianalisis. kadang kala disebut juga dengan index dari suatu search engine.
Result Engine
Mesin yang melakukan penggolongan
dan penentuan peringkat dari hasil pencarian pada search engine. Mesin ini
menentukan halaman mana yang menemui kriteria terbaik dari hasil pencarian
berdasarkan permintaan penggunanya, dan bagaimana bentuk penampulan yang akan
ditampilkan.
Proses ini dilaksanakan
berdasarkan algoritma perangkingan yang dimiliki oleh search engine
tersebut, mengikuti kaidah perangkingan hakaman yang dipergunakan oleh mereka
adalah hak mereka, para peneliti mempelajari sifat-sifat yang mereka gunakan,
terutama untuk meningkatkan pencarian yang dihasilkan oleh serach engine
tersebut.
Web Server
Merupakan komponen yang melayani
permintaan dan memberikan respon balik dari permintaan tersebut. Web Server ini
biasanya menghasilkan informasi atau dokumen dalam format HTML.
Pada halaman tersebut tersedia layanan untuk mengisikan kata kunci pencarian
yang diinginkan oleh usernya. Web Server ini juga bertanggung jawab dalam
menyampaikan hasil pencarian yang dikirimkan kepada komputer yang meminta
informasi.