Hmm.. siapa juga yang gak takjub sama cara kerja search engine atau mesin pencari ini, dengan beberapa detik saja pertanyaan yang kita tanyakan akan langsung dijawab lewat website-website yang disediakan. Dan mungkin juga untuk yang belajar seo mungkin wajib juga untuk mempelajari bagaimana sebenarnya cara kerja search engine itu.
cara kerjanya bisa kita lihat dalam penggambaran dibawah ini :
dan untuk penjelasannya :
- Sebuah search engine memiliki komponen yang disebut sebagai spider (laba-laba) atau sering disebut juga dengan crawler. Elemen spider tersebut melakukan kunjungan atau mengakses ke situs-situs internet untuk membaca isinya dan mengikuti berbagai link yang ada dalam situs tersebut. Biasanya search engine melakukan kunjungan tersebut secara berkala untuk melihat jika ada perubahan-perubahan yang terjadi.
- Program yang dikenal sebagai crawler, spider atau robot yang digunakan Google sebagai petugas penjelajah dunia internet tersebut dinamakan Cusco, Scooter dan Deephot. Ketiga program Google tersebut menilai sebuah situs dengan berbagai cara. Pertama-tama mencari info utama dari sebuah tittle-tag, HTML tag, serta meta tag. Selain itu, juga menelusuri teks yang ada pada situs beserta link-nya. Tidak ketinggalan pula untuk memeriksa file robot.txt yang memuat informasi mana saja yang boleh diteruskan dan yang tidak. Dari hal ini maka aka ada direktori tertentu yang diabaikan pendataannya. Terutama pada file-file yang berisi informasi sensitif.
- Tiap-tiap elemen yang ditemui oleh sang laba-laba (spider) akan direkam (record) dalam sebuah index. Mirip sebuah buku raksasa yang berisikan copy dari situs yang telah ditemukan. Apabila ditemukan perubahan pada situs, secara otomatis pula spider melakukan update.
- Google melakukan proses pengindeksan tersebut secara otomatis dan teratur. Pada saat itu pula Google mendata halaman baru, membuang link yang mati, dan memperbarui link tersebut.
- Terkadang diperlukan proses penulisan halaman baru dari yang ditemukan spider. Jadi, akan ada kemungkinan bahwa informasi terbaru dalam situs internet tersebut tidak masuk dalam katalog index.
- Selanjutnya, aplikasi search engine yang bertugas memilah ribuan data yang terdapat dalam katalog. Serta mencocokkannya sesuai dengan permintaan si pencari. Barulah kemudian menampilkannya berupa daftar sesuai dengan urutan (ranking). aplikasi yang digunakan Google untuk membuat ranking tersebut dikenal dengan sebutan PageRank.
- Sebelum sebuah search engine menampilkan hasil pencariannya, search engine tersebut haruslah terlebih dahulu menemukan dokumen yang dicari. Andaikata search engine tidak memberikan informasi yang kita cari, itu bukan berarti informasi tersebut tidak tersedia di internet. Bisa jadi informasi yang kita cari tersebut belum ditemukan oleh search engine.
- Sewaktu mencari informasi menggunakan Google, Google akan mengabaikan beberapa kata berikut: a, about, an, and, are, as, at, be, by, from, how, i, in, is, it, of, on, or, that, the, this, to, we, what, when, where, which, dan with.
Dan mungkin ini masih cara kerjanya secara garis besar saja, belum secara detai. Dan mungkin akan lebih rumit lagi jika kita mempelajari bagaimana kerja search engine secara detail.
0 komentar:
Posting Komentar