Movie review score
5

Bộ máy tìm kiếm (Search Engine), sơ khai là một phần mềm nhằm tìm ra các website có mặt trên mạng Internet mà  có nội dung theo yêu cầu người dùng dựa vào các thông tin mà những trang web này có. Lưu lượng thông tin của công cụ tìm kiếm thực chất là một loại database cực lớn. Việc tìm kiếm các thông tin này sẽ dựa trên các keyword được người dùng gõ vào và trả về một danh mục nào đó trong website có chứa từ khóa(keyword) mà nó tìm được.

thuat-toan-google


Từ khóa được hiểu như là một tổ hợp các từ của một ngôn ngữ nhất định được sắp xếp hay quan hệ với nhau thông qua các biểu thức logic mà công cụ tìm kiếm hỗ trợ. Trong trường hợp một từ khoá bao gồm nhiều hơn một chữ thì có thể gọi tập họp tất cả các chữ đó là bộ từ khoá (set of keywords).
Database mà công cụ tìm kiếm sử dụng thường được bổ sung cập nhật thường xuyên bằng các hình thức như scan, điều chỉnh, thêm bớt nội dung và index lại tất cả các trang mà nó có thể tìm gặp trên Internet.

Ngày nay, với số lượng lớn các website lên đến hàng tỉ, nên việc tìm ra số trang có chứa nội dụng đòi hỏi của từ khoá có thể lên đến hàng triệu trang. Do đó, việc hiển thị các trang tìm thấy theo đúng thứ tự quan trọng của các trang và theo mong muốn của người dùng cũng là một trở ngại lớn đối với bộ máy tìm kiếm. Điều này đòi hỏi sự chắt và khéo léo về cách thức đặt ra từ khoá từ người dùng.
Một bộ máy tìm kiếm dữ liệu là một hệ thống phần mềm máy tính giúp con người tìm kiếm các thông tin được lưu trữ trên hệ thống máy tính như mạng Internet, hoặc máy tính cá nhân. Nó cho phép người sử dụng yêu cầu các thông tin với những từ khóa nhất định và nhận về một danh sách các kết quả liên kết đến các website mà họ mong muốn. Bộ máy tìm kiếm sử dụng hệ thống chỉ mục để có thể tìm kiếm thông tin một cách nhanh chóng và hiệu quả.

Các thuật ngữ liên quan

Các thuật toán hay kỹ thuật mà bộ máy tìm kiếm dùng để xếp hạng hay đánh giá tầm quan trọng của một website  theo một từ khoá cho trước gọi là sự phân hạng (ranking).
Các kỹ thuật thay đổi mã nguồn HTML của một trang web cũng như các kỹ thuật khác ngoài việc sửa mã nguồn HTML nhằm nâng cao tối đa thứ hạng của trang web đối với một số từ khóa nào đó trên bộ máy tìm kiếm gọi là  tối ưu hoá công cụ  tìm kiếm hay SEO (Search Engine Optimization).



Hoạt động phân hạng các trang Web

Ngoài việc xử lý số lượng trang tìm thấy theo yêu cầu của một từ khoá trong database, bộ máy tìm kiếm của Google còn phải tìm cách chống lại sự nhiễu loạn của các trang không có nội dung phù hợp với yêu cầu nhưng vẫn lọt vào danh sách tuyển chọn của bộ máy tìm kiếm.
Nguyên nhân của sự nhiễu loạn này là việc các website chuyên về quảng cáo hay tiếp thị luôn luôn tìm cách để lọt vào hàng đầu trong danh sách tuyển chọn của bộ máy tìm kiếm, và qua đó họ có thể giới thiệu sản phẩm của họ đến người dùng. Ngược lại, người dùng, trong đa số các trường hợp, không muốn tìm các quảng cáo tiếp thị mà chỉ muốn tìm các dữ liệu khác theo ý mong muốn của họ

Vì vậy việc phân hạng các website được tìm thấy bởi bộ máy tìm kiếm cho sẽ dựa vào việc áp dụng thêm các thuật toán hay biện pháp xử lý đặc biệt:

Những tiêu chí quan trọng dùng trong thuật toán của Google

Dưới đây là các tiêu chí chủ yếu mà  thuật toán của bộ máy tìm kiếm sử dụng để phân hạng các trang web:

1.    Tần số xuất hiện :

được hiểu là tổng số lần xuất hiện của một keyword trong nội dung của một website nào đó. Theo đánh giá của các chuyên gia, thì tần số xuất hiện của một trang web càng cao sẽ chứng tỏ nội dung của trang web đó càng tốt. Do đó, mật độ từ khóa đóng vai trò rất quan trọng trong việc phân hạng một website.

2.    Thẻ meta và thẻ title:

Trong ngôn ngữ HTML, thì thẻ meta là các câu lệnh nằm ở phần đầu (header) trong mã nguồn của một trang Web. Thẻ meta có dạng:

<META (các thông số cho câu lệnh meta)>

Trong bộ máy tìm kiếm, người thiết kế còn cho rằng sự xuất hiện các chi tiết hay toàn bộ nội dung của từ khoá càng sớm trong một trang mã HTML thì điều đó chứng tỏ trang đó có thể có chủ đề liên quan càng nhiều đến từ khoá. Hậu quả là một trang Web có thể được phân hạng cao hơn nếu các phần hay toàn bộ từ khoá có mặt sớm hơn trong phần mã HTML. Như vậy, trong một số thẻ meta, bộmays tìm kiếm sẽ đọc nội dung và lấy ra các yếu tố phân hạng. Các thẻ meta có nhiều hiệu lực cho việc phân hạng là:

o    <META name="description" content="(miêu tả ngắn nội dung trang Web)">
o    <META name="keywords" content="(danh sách từ khoá)">
o    <title>(tựa đề của trang Web)</title>

3.Ngôn ngữ:

Nếu một người dùng đang nối vào Internet bằng một máy tính sử dụng tiếng Pháp thì việc hiển thị các trang Web có cùng ngôn ngữ Pháp với máy tính đó rõ ràng là hiệu quả hơn cho người đó. Do đó, yếu tố ngôn ngữ của trang Web cũng được chú ý trong phân hạng.

4.Số lượng liên liên kết ngoài:

Theo  đánh giá của các chuyên gia phát triển bộ máy tìm kiếm thì nếu một website được nhiều người dùng ở những nơi khác nhau truy cập tới thì rõ ràng giá trị của website đó sẽ  cao hơn là website cùng nội dung nhưng lại không có hay ít liên kết bên ngoài.

Kì sau mình sẽ giới thiệu đến các bạn kĩ thuật nâng cao thứ hạng cho một trang web

Leave a Reply