Selasa, 08 Juli 2014

CARA KERJA MESIN PENCARI (SEARCH ENGINE)


Mesin pencari atau Search engine adalah program komputer yang dirancang untuk melakukan pencarian atas berkas-berkas yang tersimpan dalam layanan www, ftp, publikasi milis, ataupun news group dalam sebuah ataupun sejumlah komputer peladendalam suatu jaringan. Search engine merupakan perangkat pencari informasi dari dokumen-dokumen yang tersedia. Hasil pencarian umumnya ditampilkan dalam bentuk daftar yang seringkali diurutkan menurut tingkat akurasi ataupun rasio pengunjung atas suatu berkas yang disebut sebagai hits. Informasi yang menjadi target pencarian bisa terdapat dalam berbagai macam jenis berkas seperti halaman situs web, gambar, ataupun jenis-jenis berkas lainnya.
Cara kerja mesin pencari
Mesin pencari web bekerja dengan cara menyimpan informasi tentang banyak halaman web, yang diambil langsung dari WWW. Halaman-halaman ini diambil dengan web crawler — browser web otomatis yang mengikuti setiap pranala/link yang dilihatnya. Isi setiap halaman lalu dianalisis untuk menentukan cara indeks-nya (misalnya, kata-kata diambil dari judul, subjudul, atau field khusus yang disebut meta tag). Data tentang halaman web disimpan dalam sebuah database indeks untuk digunakan dalam pencarian selanjutnya. Sebagian mesin pencari, seperti Google, menyimpan seluruh atau sebagian halaman sumber (yang disebut cache) maupun informasi tentang halaman web itu sendiri.
Selain halaman web, Mesin pencari juga menyimpan dan memberikan informasi hasil pencarian berupa pranala yang merujuk pada file, seperti file audio, file video, gambar, foto dan sebagainya, serta informasi tentang seseorang, suatu produk, layanan, dan informasi beragam lainnya yang semakin terus berkembang sesuai dengan perkembangan teknologi informasi.
Ketika seseorang mengunjungi mesin pencari dan memasukkan query, biasanya dengan memasukkan kata kunci, mesin mencari indeks dan memberikan daftar halaman web yang paling sesuai dengan kriterianya, biasanya disertai ringkasan singkat mengenai judul dokumen dan kadang-kadang sebagian teksnya.
Ada jenis mesin pencari lain: mesin pencari real-time, seperti Orase. Mesin seperti ini tidak menggunakan indeks. Informasi yang diperlukan mesin tersebut hanya dikumpulkan jika ada pencarian baru. Jika dibandingkan dengan sistem berbasis indeks yang digunakan mesin-mesin seperti Google, sistem real-time ini unggul dalam beberapa hal: informasi selalu mutakhir, (hampir) tak ada pranala mati, dan lebih sedikit sumber daya sistem yang diperlukan. (Google menggunakan hampir 100.000 komputer, Orase hanya satu.) Tetapi, ada juga kelemahannya: pencarian lebih lama rampungnya.
Manfaat mesin pencari bergantung pada relevansi hasil-hasil yang diberikannya. Meskipun mungkin ada jutaan halaman web yang mengandung suatu kata atau frasa, sebagian halaman mungkin lebih relevan, populer, atau autoritatif daripada yang lain. Kebanyakan mesin pencari menggunakan berbagai metode untuk menentukan peringkat hasil pencarian agar mampu memberikan hasil “terbaik” lebih dahulu. Cara mesin menentukan halaman mana yang paling sesuai, dan urutan halaman-halaman itu diperlihatkan, sangat bervariasi. Metode-metode nya juga berubah seiring waktu dengan berubahnya penggunaan internet dan berevolusinya teknik-teknik baru.
Sebagian besar mesin pencari web adalah usaha komersial yang didukung pemasukan iklan dan karenanya sebagian menjalankan praktik kontroversial, yaitu membolehkan pengiklan membayar agar halaman mereka diberi peringkat lebih tinggi dalam hasil pencarian.
Proses Pencarian
Melakukan pencarian dokumen yang dimuat pada suatu situs bisa begitu mudah dan kelihatannya mungkin sulit juga. apalagi mengignat begitu menyebarnya informasi dimana-mana, bahkan University of Calofornia menyebutkan saat ini telah terdapat lebih dari 50 milyar halaman web di internet, meskipun tidak ada ada satupun yang benar-benar tahu jumlah persisnya.
kesulitan yang mungkin terjadi adalah karena WWW tersebut tidak terdata dalam bentuk yang terstandardisasi isinya. tidak sama halnya dengan katalog yang ada di perpustakaan, yang memiliki standardisasi secara mendunia berdasarkan subjek dari judul buku, meskipun jumlahnya juga tidak sedikit.
Dalam pencarian di web, pengguna selalu memperkirakan kata apa yang di kira-kira terdapat pada halaman yang ingin anda temukan. atau kira-kira apa subjek yang dipilih oleh seseorang untuk mengelolah halaman situs yang mereka kelola, topik apa saja kira-kira yang di bahas.
Jika pengguna melakukan apa yang dikenal dengan pencarian pada halaman web, sebenarnya tidaklah melakukan pencarian. tidak mungkin melakukan pencarian di WWW secara langsung.
Pada web benar-benar terdiri dari banyak sekali halaman web yang ingin disimpan dari berbagai server diseluruh dunia. Komputer pengguna tidak langsung melakukan pencarian kepada seluruh komputer tersebut secara langsung.
Apa yang mungkin pengguna lakukan hanyalah melalui komputer untuk mengakses satu atau lebih perantara yang disebut dengan alat bantu pencarian yang ada saat ini. Melakukan pencarian pada alat bantu itu tadi ke database yang dimiliki. data base tersebut mengkoleksi situs-situs yang ditemukan dan simpan.
alat bantu pencarian ini menyediakan hasil pencarian dalam bentuk hypertext link dengan URL menuju halaman lainnya. ketika anda klik link ini, dan menuju ke alamat tersebut maka dokumen, gambar, suara dan banyak lagi bentuk lainnya yang ada pada server tersebut disediakan, sesuai dengan informasi yang terdapat di dalamnya. layanan ini bisa menjangkau ke manapun di seluruh dunia.
Prinsip Umum dari Mesin Pencari
Sistem kinerja mesin ini ada beberapa hal yang perlu di perhatikan terutama keterkaitannya dengan masalah arsitekrut dan mekanismenya.
Spider
Merupakan program yang men-download halaman-halaman yang mereka temukan, mirip dengan browser. Perbedannya adalah bahwa browser menapilkan secara langsung informasi yang ada (baik tekas, gambar, dll). Untuk kepentingan manusia yang menggunakannya pada saat itu, sedangkan spider tidak melakukan untuk menampilkan dalam bentuk yang terlihat seperti itu, karena kepentingannya adalah untuk mesin, bukan untuk manusia, spider pun dijalankan oleh mesin secara otomatis. Kepentingannya adalah untuk mengambil halaman-halaman yang dikunjunginya untuk disimpan kedalam database yang dimiliki oleh search engine.
Crawler
Merupakan program yang dimiliki search engine untuk melacak dan menemukan link yang terdapat dari setiap halaman yang ditemuinya. Tugasnya adalah untuk menentukan spoder harus pergi kemana dan mengevaluasi link berdasarkan alamat yang ditentukan dari awal. Crawler mengikuti link dan mencoba menemukan dokumen yang belum dikenal oleh search engine.
Indexer
Komponen ini melakukan aktifitas untuk menguraikan masing-masing halaman dan meneliti berbagai unsur, seperti teks, headers, struktur atau fitur dari gaya penulisan, tag HTML khusus, dll.
Database
Merupakan tempat standar untuk menyimpan data-data dari halaman yang telah dikunjungi, di-download dan sudah dianalisis. kadang kala disebut juga dengan index dari suatu search engine.
Result Engine
Mesin yang melakukan penggolongan dan penentuan peringkat dari hasil pencarian pada search engine. Mesin ini menentukan halaman mana yang menemui kriteria terbaik dari hasil pencarian berdasarkan permintaan penggunanya, dan bagaimana bentuk penampulan yang akan ditampilkan.
Proses ini dilaksanakan berdasarkan algoritma perangkingan yang dimiliki oleh search engine tersebut, mengikuti kaidah perangkingan hakaman yang dipergunakan oleh mereka adalah hak mereka, para peneliti mempelajari sifat-sifat yang mereka gunakan, terutama untuk meningkatkan pencarian yang dihasilkan oleh serach engine tersebut.
Web Server
Merupakan komponen yang melayani permintaan dan memberikan respon balik dari permintaan tersebut. Web Server ini biasanya menghasilkan informasi atau dokumen dalam format HTML. Pada halaman tersebut tersedia layanan untuk mengisikan kata kunci pencarian yang diinginkan oleh usernya. Web Server ini juga bertanggung jawab dalam menyampaikan hasil pencarian yang dikirimkan kepada komputer yang meminta informasi.

1. Mesin Pencari Google

Cara Kerja Search Engine 1: Menjelajahi Dan Menyusun Index
  • Google mengawali proses kerjanya dengan menjelajahi semua halaman yang ada di internet (saat ini ada lebih dari 60 Triliun halaman)
  • Mesin Pencari ini mengirimkan robotnya untuk mengunjungi semua halaman dengan cara mengikuti link dari suatu halaman ke halaman lainnya. (pemilik situs bisa mencegah halaman-halamannya dimasuki oleh robot mesin pencari dengan memasang robots.txt yang melarang semua robot atau robot tertentu untuk masuk)
  • Google mengurutkan semua halaman itu berdasarkan kontennya dan faktor-faktor lainnya, dan sesudah itu menyimpan rekamannya dalam index (pusat kumpulan data Google)
Cara Kerja Search Engine 2: Pencarian Dan Algoritma
  • Saat anda mengetikkan sesuatu di kotak pencarian, maka apa yang anda ketikkan itu akan terkirim dan diproses di sistem
  • Mesin pencari akan bekerja mencari petunjuk-petunjuk untuk memahami apa yang anda inginkan, dan di sini ada 6 proses:
    • Ejaan, untuk menilai apakah ejaan anda sudah benar, dan jika salah maka Google akan memberi saran
    • Autocomplete, di mana Google memperkirakan apa yang kira-kira dicari dengan berbagai variasi makna lainnya
    • Sinonim, Google berusaha melihat dokumen-dokumen lain yang mengandung kata-kata yang sinonim dengan pencarian anda
    • Metode Pencarian, Google juga menyediakan data lain dalam format tertentu seperti video, atau gambar yang berkaitan dengan kata kunci tersebut
    • Google Instant, yang berusaha menampilkan hasil secepat mungkin kepada anda.
  • Dari semua petunjuk yang dikumpulkan di atas Google akan menarik data dari tempat penyimpanannya tadi yang kita sebut index.
  • Proses menampilkan data ini (ranking) harus melalui algoritma Google:
    • Kualitas Situs dan Halaman -- Algoritma Google akan bekerja untuk mengenali seberapa terpercaya, bereputasi, dan berotoritasnya suatu sumber dengan menggunakan beberapa parameter. Salah satu di antara parameter itu adalah pagerank
    • Kesegaran -- Google juga memandang penting untuk mempertimbangkan informasi-informasi terbaru untuk ditampilkan dalam hasil pencariannya
    • Pencarian Aman -- Google sebisa mungkin mengurangi hasil pencarian yang berkonten dewasa dari hasil pencarian anda (kecuali anda memang mencari konten dewasa). Jadi kalau anda bukan situs konten dewasa, tapi memasang iklan yang menuju situs yang mengandung konten dewasa, maka kemungkinan anda untuk ranking akan berkurang
    • Konteks Pengguna -- Google juga akan melihat posisi geografis kita dan cookie pada komputer untuk menentukan ranking halaman yang ditampilkannya....
    • Bahasa -- Google juga akan menggolongkan hasil pencarian berdasarkan bahasa dan negara
    • Konten Umum -- Ini seperti gambar, video, berita, peta, dan lain-lain yang juga akan diikutsertakan dalam halaman hasil pencarian.
  • Semua proses di atas berlangsung dalam 1/8 detik sebelum dikirimkan ke layar anda.

2. Mesin Pencari Yahoo



Yahoo merupakan mesin pencari terbesar kedua setelah google menempatkan dirinya sebagai acuan bagi pengguna internet untuk mencari halaman berdasarkan kata kunci tertentu. Selain sebagai mesin pencari yahoo memiliki layanan yang cukup banyak dengan berbagai fitur dan keunggulan yang dimilikinya.

Pada saat melakukan pencarian di Yahoo, sebagai mesin pencari Yahoo langsung mencari dari miliaran jenis dokumen web yang tersebar dari berbagai situs. Yahoo! Search kemudian membuat keputusan dengan cara membaca dan melihat relevansi komparatif setiap dokumen untuk permintaan pencarian dari kata kunci yang anda cari/masukkan, setelah itu terlihat berbagai halaman web dari hasil pencarian, urutan pada hasil yang ditampilkan ini disebut sebagai peringkat. Dari urutan teratas peringkat 1 pada Page 1 merupakan yang terbaik diikuti peringkat yang lainnya.

Mesin pencari yahoo tidak memiliki kemampuan untuk mengajukan pertanyaan pada setiap halaman yang ditampilkan pada sang pembuat atau pemilik akan kepantasan dan keakuratan atau besarnya informasi yang di sampaikan. Pada mesin pencari Yahoo mengandalkan istilah pencarian dengan keyword yang dimasukkan untuk menafsirkan dan menentukan tujuan pencarian.

0 komentar:

Posting Komentar