Tuesday, September 20, 2011

Cách tính pagerank mới của google


Gần đây Mattcults, một chuyên gia Seo từ Google đã lên tiếng bật bí về cách tính PageRank mới của Google. Liệu những bật bí đó có gì mới, các webmaster cần có những thay đổi gì về chiến thuật, thủ thuật mới cho sự phát triển thứ hạng website.
Vấn đề đưa ra với cụm từ “Điêu khắc PageRank”. Tôi đã cố suy ngẫm và hiểu về cụm từ ấy một cách chính xác và mạch lạc.
Mattcults nói:
ðMọi người nghĩ về PageRank theo nhiều cách khác nhau. Nhiều người đã so sánh PageRank với 1 mô hình sóng ngẫu nhiên mà PageRank mà ở đó những lượt truy cập ngẫu nhiên với những click ngẫu nhiên trên các vùng của website mang lại điểm số. Phần khác thì nghĩ đến trang web như 1 ma trận liên kết mà có giá trị ở 1 vị trí cho thấy sự hiện diện của các liên kết từ trang i sang trang j. trong trường hợp đó, PageRank tương ứng với vec tơ riêng chính của liên kết bình thường hóa ma trận.
ðSự từ bỏ: Ngay cả khi tôi gia nhập công ty vào năm 2000, Google đã làm được nhiều hơn những tính toán liên kết phức tạp như tôi nghĩ, bạn sẽ quan sát từ các bài báo PR cổ điển. Nếu bạn tin rằng Google ngừng đổi mới trong phân tích liên kết, đó là một điều sai lầm. Mặc dù chúng ta vẫn gọi nó là PR, Google có khả năng tính toán danh tiếng dựa trên các liên kết đã nâng cao đáng kể trong những năm qua. Tôi sẽ làm phần còn lại của bài viết trên blog của tôi trong khuôn khổ của “cổ điển PR” nhưng nhớ rằng đó không phải là sự tương tự hoàn hảo.
Có lẽ cách phổ biến nhất để hình dung PageRank như là một dòng chảy xảy ra giữa các tài liệu trên outlinks. Trong một cuộc nói chuyện gần đây tại WordCamp tôi đã chỉ ra một hình ảnh được lấy từ văn bản gốc của thuật toán PageRank.

Trong hình trên, tài liệu dưới bên trái “chín điểm của PageRank” và ba liên kết mở. Các kết quả PageRank chảy dọc theo mỗi liên kết mở là chín chia ba = ba điểm PageRank.
pagerank flow1 Cách tính pagerank mới của google
Đó là mô hình đơn giản không làm việc hoàn hảo, tuy nhiên. Hãy tưởng tượng nếu có một vòng lặp.
pagerank loop2 Cách tính pagerank mới của google
Không có PageRank nào thoát khỏi vòng lặp, và như thế các PageRank cứ chảy vào vòng lặp, cuối cùng các PageRank trong vòng lặp sẽ đạt đến vô cực. PageRank vô hạn chưa hẳn đã hoàn toàn hữu ích. Larry và Sergey đã giới thiệu về một yếu tố khác, yếu tố phân rã. Có thể thấy rằng 10-15% PageRank trên bất kỳ một trang nào biến mất trước khi chảy theo outlinks. Trong mô hình lướt ngẫu nhiên, phân rã được biết đến như những người lướt web ngẫu nhiên đã chán và quyết định chuyển sang một website khác. Vấn đề được giải quyết nhẹ nhàng với một vector thiết lập lại, như một vector riêng rẽ. Nhưng điều này ngoài phạm vi của cuộc thảo luận này.
Bây giờ chúng ta hãy nói về thuộc tính của link rel – nofllow. Nofollow là thuộc tính được đưa ra từ năm 2005 được hầu hết các Máy tìm kiếm hiện nay biết đến, nó chú thích một liên kết để nói cho công cụ tìm kiếm như Google rằng liên kết này không lập chỉ mục cho tính điểm PageRank, “Tôi không thể hoặc không chắc sẽ đảm bảo cho liên kết này”.
Điều gì sẽ sảy ra với một website có điểm PagrRank = 10, 10 liên kết ra ngoài (out links), trong đó có 5 là nofollow? Chúng ta bỏ yếu tố phân rã qua một bên để tập trung vào phần cốt lõi của câu hỏi. Ban đầu, năm liên kết không có nofollow sẽ được tính 2 điểm PageRank (bản chất thì các liên kết đi theo không tính vào mẫu số khi chia PageRank bởi các đơn vị out page). Hơn một năm trước đây, Google đã thay đổi như thế nào PageRank chảy để 5 liên kết dofollow lưu lại một điểm PageRank.

No comments:

Post a Comment

Popular Posts