Google TrustRank

Nếu bạn đã từng nghe hoặc nhìn thấy cụm từ “TrustRank” trước đây, có thể bất kỳ ai đang viết về nó hoặc đề cập đến nó đang thảo luận về một bài báo của Yahoo / Stanford có tiêu đề Chống Spam Web với TrustRank (pdf). Trong khi bài báo TrustRank đó là công trình chung của các nhà nghiên cứu từ Đại học Stanford và Yahoo, nhiều nhà văn đã gọi nó là Google TrustRank kể từ ngày xuất bản năm 2004.

Trong khi Yahoo có cách tiếp cận TrustRank, Google không có cách tiếp cận tương tự. Yahoo TrustRank nhằm xác định Spam trên Web. Nó đã được cấp bằng sáng chế, với tên Phát hiện thư rác dựa trên liên kết. Bởi vì bằng sáng chế của Yahoo đó tồn tại, Google không thể được cấp bằng sáng chế bao gồm các quy trình tương tự – USPTO sẽ không cấp bằng sáng chế đó. Tuy nhiên, có một Google TrustRank.

Sự nhầm lẫn về việc ai là người đưa ra ý tưởng về TrustRank đã không được Google giải quyết bằng thuật ngữ “TrustRank” vào năm 2005. Nhãn hiệu đó đã bị Google loại bỏ vào ngày 29 tháng 2 năm 2008, theo hồ sơ tại cơ sở dữ liệu USPTO Tess:

Google TrustRank

Nhưng có vẻ như Google đã đưa ra một hệ thống để sắp xếp lại thứ hạng của các trang web dựa trên Google TrustRank. Điều này không giống với cách tiếp cận của Yahoo vì nó không phải là một phương pháp để chống lại Spam theo cách của Yahoo TrustRank.

Google TrustRank có tồn tại không?

Google TrustRank

Google không sao chép TrustRank của Yahoo bởi vì Yahoo đã cấp bằng sáng chế cho ý tưởng và có thể loại trừ Google khỏi việc sử dụng quy trình TrustRank của họ. Bạn nên đọc qua cả hai bằng sáng chế để hiểu chúng khác nhau như thế nào. Google TrustRank phải thay đổi thứ hạng của kết quả tìm kiếm thay vì tìm Webspam như Yahoo TrustRank.

Tuần trước, một bằng sáng chế được cấp cho Google vào tuần trước đã thảo luận về cách TrustRank có thể được liên kết với những người dán nhãn cho các trang web thông qua các chú thích trong khi thiết lập một công cụ tìm kiếm tùy chỉnh. Ý tưởng sử dụng chú thích khá thú vị khi xem xét bản phát hành Sidewiki gần đây của Google – nhưng Google không có dấu hiệu nào cho thấy Sidewiki và hệ thống tin cậy của người dùng trong bằng sáng chế này có liên quan.

Một số ý tưởng trong bằng sáng chế của Google từ nhà phát minh Ramanathan Guha có vẻ hơi giống với một bài báo mà ông là đồng tác giả khi còn làm việc cho IBM – Tuyên truyền niềm tin và sự ngờ vực (pdf).

Bản thân bằng sáng chế TrustRank của Google là:

  • Xếp hạng kết quả tìm kiếm dựa trên sự tin cậy
  • Được phát minh bởi Ramanathan Guha
  • Đã giao cho Google
  • Bằng sáng chế Hoa Kỳ 7.603.350
  • Cấp ngày 13 tháng 10 năm 2009
  • Lưu: 09/05/2006

Thuật:

Hệ thống công cụ tìm kiếm cung cấp kết quả tìm kiếm được xếp hạng theo thước đo độ tin cậy được liên kết với các thực thể đã cung cấp nhãn cho các tài liệu trong kết quả tìm kiếm. Công cụ tìm kiếm nhận được một truy vấn và chọn các tài liệu có liên quan đến truy vấn.

Công cụ tìm kiếm cũng xác định các nhãn được liên kết với các tài liệu đã chọn và xếp hạng tin cậy của các thực thể đã cung cấp nhãn. Các cấp độ tin cậy được sử dụng để xác định các yếu tố tin cậy cho các tài liệu tương ứng. Các yếu tố tin cậy được sử dụng để điều chỉnh điểm truy xuất thông tin của tài liệu. Kết quả tìm kiếm sau đó được xếp hạng dựa trên điểm số truy xuất thông tin đã được điều chỉnh.

Một ý tưởng đằng sau bằng sáng chế là các chuyên gia về nhiều chủ đề có thể được tìm thấy tại nhiều trang web, cho dù trên các trang cho phép các chuyên gia hoặc nhà bình luận cá nhân thể hiện bản thân trong các blog và cửa hàng tin tức và các nguồn tương tự hoặc tại các trang web nơi cộng đồng tương tác, chẳng hạn như diễn đàn và trang web xếp hạng.

Một số thành viên của trang web nơi mọi người đưa ra ý kiến ​​của họ có thể được coi là chuyên gia, trong khi những người khác có thể bị coi là ít thông tin hơn hoặc có thành kiến ​​nào đó.

Ví dụ về các dấu hiệu đáng tin cậy đối với một số cá nhân tham gia vào một trang web có thể bao gồm những thứ như các trang web đấu giá có thể sử dụng xếp hạng để xác định người mua và người bán đáng tin cậy. Các diễn đàn có thể sử dụng tiêu chí thành viên và các yếu tố khác để phân biệt giữa mức độ tin cậy mà các áp phích khác nhau có thể được coi là có.

Nếu có một cách nào đó để “phản ánh” mức độ đáng tin cậy của các trang web hoặc của bình luận hoặc ý kiến ​​có thể được liên kết với các trang hiển thị trong tài liệu kết quả tìm kiếm, thì loại thông tin dựa trên danh tiếng này có thể giúp cung cấp nhiều kết quả tìm kiếm “có ý nghĩa” hơn cho người tìm kiếm . Đó là điểm đằng sau TrustRank của Google.

Bản thân bằng sáng chế TrustRank của Google cũng đi sâu vào một số chi tiết về cách công cụ tìm kiếm có thể sử dụng thông tin từ các chú thích và nhãn từ các chuyên gia để sắp xếp lại thứ hạng của kết quả tìm kiếm theo các truy vấn.

Blog chính thức của Google sử dụng một số thuật ngữ thú vị khi thảo luận về Sidewiki được phát hành gần đây trong bài đăng của họ Trợ giúp và học hỏi từ những người khác khi bạn duyệt web: Google Sidewiki. Một điểm chung giữa cả hai là cách các chuyên gia chia sẻ ý kiến ​​của họ về một trang web có thể hữu ích cho những người xem trang web đó:

Điều gì sẽ xảy ra nếu tất cả mọi người, từ một chuyên gia địa phương đến một bác sĩ nổi tiếng, có một cách dễ dàng để chia sẻ những hiểu biết của họ với bạn về bất kỳ trang nào trên web? Điều gì sẽ xảy ra nếu bạn có thể thêm thông tin chi tiết của mình cho những người khác đang xem qua?

Bây giờ bạn có thể. Hôm nay, chúng tôi sẽ ra mắt Google Sidewiki, cho phép bạn đóng góp thông tin hữu ích bên cạnh bất kỳ trang web nào. Google Sidewiki xuất hiện dưới dạng thanh bên của trình duyệt, nơi bạn có thể đọc và viết các mục nhập dọc theo cạnh trang.

Tuy nhiên, một trong những dự án khác mà người phát minh ra bằng sáng chế này, Ramanathan Guha, đang thực hiện tại Google là các công cụ tìm kiếm tùy chỉnh mà mọi người có thể xây dựng và thêm vào các trang web của họ. Vào tháng 2 năm 2007, tôi đã viết một bài đăng trên Search Engine Land với tiêu đề Công cụ Tìm kiếm Tùy chỉnh của Google để Khai thác Trí tuệ của các Chuyên gia? trên một loạt năm hồ sơ bằng sáng chế đã liệt kê Ramanathan Guha, nhà phát minh. Trong bài đăng đó, tôi đã lưu ý rằng:

Nói tóm lại, các công cụ tìm kiếm tùy chỉnh tại các trang dọc cho phép mọi người tìm kiếm bằng cách sử dụng các nguồn nội dung do chủ sở hữu trang quyết định và có thể được chú thích.

Thông tin được thu thập từ các lựa chọn nguồn và ghi nhãn và chú thích của các nguồn đó và việc sử dụng các tìm kiếm tùy chỉnh đó có thể giúp thông báo kết quả tại các công cụ tìm kiếm tùy chỉnh khác liên quan đến các tìm kiếm có liên quan và trong các đề xuất truy vấn do Google cung cấp trên các trang kết quả tìm kiếm từ các tìm kiếm Web thông thường.

Mô tả về ghi nhãn và chú thích của các nguồn được sử dụng trong các công cụ tìm kiếm tùy chỉnh rất phù hợp với quy trình được mô tả trong bằng sáng chế TrustRank của Google.

Có thể Google đang tìm hiểu về mức độ tin cậy của các trang web và những người chú thích và gắn nhãn các trang từ nhiều nguồn. Họ tìm hiểu về những trang có thể được sử dụng trong xếp hạng tin cậy có thể ảnh hưởng đến cách các trang có thể được xếp hạng trên công cụ tìm kiếm. Tôi đã viết một bài đăng khác về các tệp ngữ cảnh trong Công cụ Tìm kiếm của Google và cách những người xây dựng các tìm kiếm tùy chỉnh đó được coi là chuyên gia về chủ đề, trong bài đăng Chuyên môn của Công cụ Tìm kiếm Tùy chỉnh của Google so với Trí tuệ của Đám đông.

TrustRank của Google này rất khác với TrustRank được phát triển bởi các tác giả của bài báo Stanford / Yahoo.

Lần tới khi bạn nghe ai đó đề cập đến “TrustRank”, bạn có thể muốn hỏi họ xem họ muốn nói đến TrustRank của Google hay Yahoo TrustRank. Chúng không giống nhau.