как продавать трафик | полезные скрипты | технические вопросы

вопросы хостинга | продвижение сайтов | поисковые системы

Патент Google
«Документальный поиск, основанный на временнЫх данных»

Перевод: SEOnews

Содержание

1. Предмет заявки
2. Описание
3. Подробное описание изобретения

3.1 Типовая конфигурация сети
3.2 Типовая клиент/серверная архитектура
3.3 Типовая поисковая система
3.4 Типы временных данных
3.4.1 Дата создания документа
3.4.2 Обновление контента
3.4.3 Анализ запросов
3.4.4 Ссылочный критерий
3.4.5 Ссылочный текст
3.4.6 Трафик
3.4.7 Поведение пользователя
3.4.8 Информация о домене
3.4.9 История ранжирования
3.4.10 Заданные/выработанные пользователем данные
3.4.11 Уникальные слова, биграммы, фразы в ссылочном тексте
3.4.12 Связь независимых одноранговых узлов
3.4.13 Разделы документа
4. Примерная обработка
5. Заключение

 

США. Заявка на патент № 20050071741. Март 31, 2005.

Документальный поиск, основанный на временных данных

(Information Retrieval Based on Historical Data)

Краткий обзор

Система, идентифицирующая документ и получающая временные данные, связанные с документом. Система может оценивать документ, по крайней мере, частично, по одному или нескольким типам временных данных.

Создатели:

Ачари, Анураг (Кэмпбелл, штат Калифорния);
Катт, Маттс (Маутин Вью, штат Калифорния);
Дин, Джефри (Пало–Альто, штат Калифорния);
Хагр, Пол (Сан–Франциско, штат Калифорния);
Хенцингер, Моника (Лозанна);
Хельцль, Урс (Пало–Альто, штат Калифорния);
Лоуренс, Стив (Маутин Вью, штат Калифорния);
Пфлегер, Карл (Маутин Вью, штат Калифорния);
Серчиноглу, Олкан (Маутин Вью, штат Калифорния);
Тонг, Саймон (Маутин Вью, штат Калифорния).

 

Предмет заявки

1. Метод оценки документа включает в себя следующие компоненты: идентификация документа, получение одного или более типов временных данных документа, установление его ценности на основе этих временных данных.

2. Метод, описанный в пункте 1, где временные данные документа включают информацию, касающуюся момента создания документа. А проведение оценки подразумевает: установление даты создания документа и определение ценности документа по этой дате.

3. Метод, описанный в пункте 2, где документ включает в себя множество других документов, а под оценкой документа понимается: определение точного возраста каждого из множества документов (отсчёт ведется с момента его создания), определение среднего времени существования документа на основе возраста каждого из множества документов, и, по крайней мере, частичную оценку документов на основе

4. разницы между возрастами каждого из множества документов и средним временем существования документа.

5. Метод, описанный в пункте 2, где установление ценности документа включает, по меньшей мере, частичную оценку документа, за истекший период, начиная со времени создания документа.

6. Метод, описанный в пункте 2, где время начала работы над документом ведется с момента, когда поисковая система впервые находит документ или ссылку на него, или с момента, когда документ достигает заранее установленного числа страниц.

7. Метод, описанный в пункте 1, где один или более типов временных данных о документе включают информацию об изменениях контента документа с течением времени. Установление ценности включает: определение частоты, с которой изменяется весь контент документа или его часть.

8. Метод, описанный в пункте 6, где частота, с которой изменяется контент документа, зависит: от среднего времени, за которое происходят изменения, от количества изменений за определенный период времени, и сравнительной оценки изменений документа за текущий и предыдущий период времени.

9. Метод, описанный в пункте 6, где установление ценности также включает: определение объёма изменяющегося с течением времени контента, оценку документа на основе частоты изменения объёма контента с течением времени.

10. Метод, описанный в пункте 8, где объём изменяющегося контента зависит: от количества новых страниц, относящихся к данному документу, от соотношения количества новых страниц к общему количеству страниц в документе. Учитывается процент контента, который был изменён в течение определённого времени.

11. Метод описанный в пункте 8, где определение объёма изменяющегося контента включает: «вес» различных частей контента документа, определяемых по их важности; установление объёма, на который изменился контент, как функцию от величины поступившего контента. Метод, описанный в пункте 6, где документ включает в себя множество других документов, а оценка документа включает: определение даты последнего изменения контента, выведение средней даты изменения с учётом точных дат изменения контента. Оценка документа осуществляется на основе разницы между датой последнего изменения контента и средней датой.

12. Метод, описанный в пункте 1, где один или более типов временных данных о документе включают: информацию, относящуюся к способу изменения контента документа со временем; установление ценности документа включает: определение объёма изменяющегося с течением времени контента и оценку этого изменения.

13. Метод, описанный в пункте 12, где объём изменяющегося контента документа, частично, зависит: от количества новых страниц, относящихся к документу, отношения количества новых страниц к общему числу страниц документа, и проценту изменённого контента с течением времени.

14. Метод, описанный в пункте 12, где определение объёма изменяющегося контента включает: те же параметры, которые описаны в пункте 10.

15. Метод, описанный в пункте 1, где один или более типов временных данных о документе включают информацию о том, насколько часто документ включается в результаты поиска, а установление ценности включает: определение размера документа, когда он был включен в результаты поиска; оценку этого документа, на основе его размера в момент включения в результаты поиска.

16. Метод, описанный в пункте 15, где оценка документа подразумевает присвоение документу более высокой ценности, если в определённый промежуток времени он включается в результаты поиска чаще других.

17. Метод, описанный в пункте 1, где один или более временных данных о документе включают информацию о том, насколько поисковые термины входят в поисковый образ запроса; а установление ценности подразумевает: определение, связан ли документ с поисковыми запросами, которые приводят к результатам, меняющимся в течение определённого промежутка времени и, по крайней мере, частичную оценку на основе указанных запросов.

18. Метод, описанный в пункте 1, где один или более типов временных данных о документе включают информацию о запросах, которые сами в течение определённого промежутка времени остаются неизменны, но результаты поиска по ним в это время изменяются; и где установление ценности включает: определение документа соответствующего запросам, влекущим изменения в результатах поиска и оценку документа на этой основе.

19. Метод, описанный в пункте 1, где один или более типов временных данных документа включают информацию об устаревших документах, а определение ценности документа включает определение актуальности документа, и оценку документа на этой основе.

20. Метод, описанный в пункте 19, где оценка документа включает: установление факта удовлетворительности данному поисковому запросу документа, определённого как устаревшего, и оценку документа на этой основе.

21. Метод, описанный в пункте 20, где определение степени актуальности устаревшего документа поисковому запросу зависит от частоты выбора данного документа наряду с новыми по этому запросу.

22. Метод, описанный в пункте 1, где один или более типов временных данных о документе включают информацию, относящуюся к динамике простановки ссылок за определённый промежуток времени, а установление ценности документа включает: определение динамики простановки ссылок документа, оценка документа на этой основе.

23. Метод, описанный в пункте 22, где ссылочная динамика зависит от постановки или снятия одной или более ссылок, относящихся к документу.

24. Метод, описанный в пункте 23, где постановка одной и более ссылок связана с датой появления, по меньшей мере, одной новой ссылки на документ, частотой простановки ссылок за определённый период времени и общим количеством ссылок. А снятие одной или более ссылок связано с датой снятия существующей ссылки, частотой их исчезновения и общим количеством ссылок снятых за определённый промежуток времени.

25. Метод, описанный в пункте 22, где динамика простановки ссылок относящихся к документу подразумевает контроль, по меньшей мере, за одной из временных характеристик ссылок, учёт количества поставленных и снятых ссылок за определённый промежуток времени, а также тенденцию к появлению большего числа новых ссылок по сравнению с числом снятых ссылок.

26. Метод, описанный в пункте 1, где один или более типов временных данных о документе включает информацию о «новизне» ссылок, а определение ценности документа подразумевает установление новизны ссылок, установление «веса» ссылок на основе их новизны и оценку документа с учётом веса новых.

27. Метод, описанный в пункте 26, где новизна ссылки, относящейся к документу, зависит, по крайней мере, частично от даты постановки ссылки и даты её изменения; даты появления ссылочного текста и даты его изменения; даты появления ссылающегося документа и его изменения.

28. Метод, описанный в пункте 26, где вес, передаваемый ссылке, зависит от степени надёжности, авторитетности и новизны документа, содержащего ссылку.

29. Метод, описанный в пункте 26, где оценка документа включает: определение возраста каждой ссылки, указывающей на документ, проведение возрастного распределения ссылок с учётом времени их существования, и, по крайней мере, частичную оценку документа на основе возрастного распределения ссылок.

30. Метод, описанный в пункте 1, где один или более типов временных данных о документе включает информацию, относящуюся к способу изменения ссылочного текста в течение долгого времени. А определение ценности документа включает: идентификацию изменений ссылочного текста соответствующего ссылке на документ, и, по крайней мере, частичную оценку документа на этой основе.

31. Метод, описанный в пункте 1, где один или более типов временных данных о документе включает информацию, касающуюся различий между документами и ссылочным текстом, соответствующему ссылкам на эти документы. А установление ценности документа включает: определение, было ли изменение контента документа, с условием, что контент отличается от ссылочного текста, соответствующего одной или более ссылкам на документ и, по меньшей мере, частичную оценку документа на этой основе.

32. Метод, описанный в пункте 1, где один или более типов временных данных о документе включает информацию, связанную с новизной ссылочного текста, и где определение ценности документа включает определение новизны ссылочного текста, соответствующего одной или более ссылкам на документ и, по меньшей мере, частичную оценку документа на этой основе.

33. Метод, описанный в пункте 32, где новизна ссылочного текста, к которому относится ссылка на документ, зависит, по крайней мере, частично от даты появления ссылочного текста и даты его изменения, даты появления документа и даты его изменения.

34. Метод, описанный в пункте 1, где один или более типов временных данных включает информацию о трафике документов, а определение ценности подразумевает определение свойств этого трафика и, по меньшей мере, частично, оценку документа на основе свойств трафика документа.

35. Метод, описанный в пункте 34, где определение свойств трафика документа включает анализ модели трафика документа с целью выявления изменений происходящих с ней за определенный промежуток времени.

36. Метод, описанный в пункте 1, где один или более типов временных данных включает информацию о поведении пользователя при пользовании документами, а определение ценности включает: наблюдение за поведением пользователя при пользовании документами и, по крайней мере, частичную оценку документа на основе этого поведения пользователя.

37. Метод, описанный в пункте 36, где поведение пользователя соотносится с тем, что хотя бы единожды документ попадал в результаты поиска и с количеством обращений пользователей к документу.

38. Метод, описанный в пункте 1, где один или более типов временных данных включает информацию о доменах, на которых расположены документы. А установление ценности включает: анализ информации о доменах, на которых расположены документы и, по крайней мере, частичную оценку документа на основе результатов анализа.

39. Метод, описанный в пункте 38, где оценка документа включает: определение факта, является ли домен, на котором расположен документ, приобретённым законно, и оценку документа на этом основании.

40. Метод, описанный в пункте 38, где информация о домене связана со сроком окончания регистрации домена, регистрационной записью DNS и с именем сервера на котором находиться домен.

41. Метод, описанный в пункте 1, где один или более типов временных данных включает информацию о динамике изменения документов в предыдущее ранжирование. А установление ценности включает определение динамики изменения документов в предыдущее ранжирование и, по крайней мере, частичную оценку документа на этой основе.

42. Метод, описанный в пункте 41, где оценка документа включает: определение количества или степени изменений в ранжировании документа за определенный промежуток времени и, по крайней мере, частичную оценку документа на этой основе.

43. Метод, описанный в пункте 41, где динамика изменения документов в предыдущее ранжирование зависит: от числа запросов, по которым документ включался в результаты поиска за определённый промежуток времени; частоты, с которой документ включался в результаты поиска за данный промежуток времени; сезонных колебаний; пакетных данных; изменения за определённый промежуток времени оценки пары запрос-URL.

44. Метод, описанный в пункте 41, где динамика изменения документов в предыдущем ранжировании включает контроль за амплитудой колебаний позиций документа в процессе ранжирования за определённый период времени.

45. Метод, описанный в пункте 1, где один или более типов временных данных включает информацию о созданных или сохранённых пользователем данных, а определение ценности включает: определение того, указывают ли созданные или сохранённые пользователем данные, что документ представляет интерес для пользователя и, по крайней мере, частичную оценку документа на этой основе.

46. Метод, описанный в пункте 45, где созданные или сохранённые пользователем данные относятся, по меньшей мере, к одному из списков Избранного, закладкам, кэшированным файлам, которые связаны между собой одним или множеством пользователей.

47. Метод, описанный в пункте 45, где оценка документа включает: анализ созданных или сохранённых пользователем данных за определённый промежуток времени для определения, по меньшей мере, одного из направлений, в соответствии с которым следует добавить или удалить данные из документа, определение частоты, с которой добавлялись или удалялись данные, созданные или сохранённых пользователем и, по крайней мере, частичную оценку документа на основе результатов анализа.

48. Метод, описанный в пункте 1, где один или более типов временных данных включает информацию об увеличении параметров ссылочного текста, и где установление ценности включает: определение возросших параметров ссылочного текста, к которому относятся одна или более ссылок на документ и, по крайней мере, частичную оценку документа на этой основе.

49. Метод, описанный в пункте 1, где один или более типов временных данных включает информацию о ссылочных связях независимых друг от друга ресурсов одного уровня, и где установление ценности документа включает: определение увеличения числа независимых друг от друга ресурсов одного уровня, которые включают документ и, по крайней мере, частичную оценку документа на основе количества указанных ресурсов.

50. Метод, описанный в пункте 1, где один или более типов временных данных включает информацию обо всех тематиках документа, и где установление ценности включает: отбор подтемы, относящейся к документу, контроль за её изменением в течение определенного промежутка времени и, по крайней мере, частичную оценку документа на основе этих изменений.

51. Метод, описанный в пункте 1, кроме того, также включает: формулировку поискового запроса, при условии, что идентифицированный документ определяется как релевантный этому запросу; оценку релевантности, которая зависит от степени релевантности документа поисковому запросу, а установление ценности документа, по крайней мере, частично зависит от типов временных данных и оценки релевантности.

52. Система оценки документа включает: способы идентификации документа, способы получения множества типов временных данных о документе и способы установления ценности документа, по крайней мере, частично зависящие от множества типов временных данных.

53. Система оценки документа включает: временной компонент, который видоизменяется в зависимости от получения одного или более типов временных данных о документе, и ранжирующий компонент, который видоизменяется в зависимости от установленной ценности документа, которая, в свою очередь, по крайней мере, частично основывается на типах временных данных.

54. Метод ранжирования документа, на который ссылаются, включает: определение возраста ссылочных связей этого документа и ранжирование документа, на который ссылаются по убывающей функции возраста ссылочных связей.

55. Метод, описанный в пункте 54, где данные о ссылочных связях включают, по меньшей мере, одну ссылку.

56. Метод, описанный в пункте 54, где данные о ссылочных связях включают ссылочный текст.

57. Метод, описанный в пункте 54, где данные о ссылочных связях включают ранжирование. По крайней мере, частично оно зависит от ссылок и ссылочного текста, соответвующих одному или более ссылающемуся документу и связанных с документом на который ссылаются.

58. Метод, описанный в пункте 57, кроме того, также включает: определение долговечности ссылочного окружения; получение показателя обновления контента ссылающегося документа, обеспечивающего данные о ссылочном окружении; регулирование процесса ранжирования ссылающегося документа на основе срока службы ссылочного окружения и показателя обновления контента ссылающегося документа.

59. Метод, описанный в пункте 58, где регулирование процесса ранжирования включает понижающее ранжирование, если срок службы ссылочного окружения короткий, и повышающее ранжирование в случае долгого срока службы ссылочного окружения.

60. Метод, описанный в пункте 59, где регулирование процесса ранжирования включает: понижающее ранжирование, если, по меньшей мере, одна часть контента ссылающегося документа учитывается как устаревшая за определённый промежуток времени и повышающее ранжирование, если часть контента ссылающегося документа обновлена за определённый промежуток времени.

61. Метод, описанный в пункте 54, включает выявление линкопомойки для ссылающегося документа, обеспечивающего данные о ссылочном окружении; и регулирование процесса ранжирования документа на основе данных о линкопомойке.

62. Метод, описанный в пункте 61, показатель линкопомойки вычисляется как функция степени, когда одна или более ссылок, обеспеченных ссылающимся документом, меняются за определенный промежуток времени.

63. Метод, описанный в пункте 62, где регулирование процесса ранжирования включает понижающее ранжирование, если линкопомойка превышает допустимый предел.

>> 2. Описание

 

как продавать трафик | полезные скрипты | технические вопросы

вопросы хостинга | продвижение сайтов | поисковые системы