как продавать трафик | полезные скрипты | технические вопросы

вопросы хостинга | продвижение сайтов | поисковые системы

Патент Google «Документальный поиск, основанный на временнЫх данных»

Подробное описание изобретения

Детальное описание изобретения связано с прилагаемыми иллюстрациями. Ссылки на номера различных иллюстраций могут указывать на одинаковые или похожие элементы. Предлагаемое детальное описание не ограничивает возможности изобретения.

Системы и методы, используемые в данном изобретении, способствуют оценке документа, используя, например, историческую информацию, касающуюся определённых документов. В системах и методах используется оценка для предоставления высококачественных результатов поиска.

«Документ» — термин, употребляемый в широком значении. Документ может включать в себя электронную почту, веб-сайт, файл, комбинацию файлов, один или более файлов, содержащих ссылки на другие файлы, блог, интернет-рекламу и др. В Интернете обычный документ — веб-страница. Веб-страницы часто включают в себя текстовую информацию, а также мета-информацию, рисунки, гиперссылки и др. Страница может относиться к документу или части документа. Поэтому слова «страница» и «документ» иногда взаимозаменяемы. В других случаях, страница относится к части документа, например, к суб-документу. Страница может относиться более чем к одному документу.

В предлагаемом ниже описании документы представлены как документы, содержащие ссылки на другие документы и/или с других документов. Например, когда документ содержит ссылку на другой документ — ссылка считается прямой. Когда ссылка указывает на документ, ссылка считается обратной. При использовании термина «ссылка» подразумевается как прямая, так и обратная ссылка.

 

Типовая конфигурация сети

Рис. 1 — типовая диаграмма сети 100, в которой могут быть применимы методы и системы, используемые в данном изобретении. Сеть 100 включает различных клиентов 110, связанных с разнообразными серверами 120-140 через сеть 150. Сеть 150 включает локальную сеть, глобальную, телефонную, Интранет, Интернет, устройство памяти, другую сеть или комбинацию сетей. Два клиента 110 и три сервера 120-140 связаны с сетью 150 из-за простоты и удобства пользования. На самом деле, клиент может выполнять функции сервера, в этом случае, становится понятно, какими конкретно функциями наделен сам клиент.

Клиенты 110 представляют собой сообщество. Такое сообщество определяется как своего рода инструмент коммуникации, напоминающий по своим функциям беспроводной телефон. Серверы 120-140 представляют собой сообщества, которые осуществляют сбор, поиск, обработку информации, а также приводят в надлежащий вид документы, которые должны удовлетворять принципам изобретения. Клиенты 110 и серверы 120-140 связываются с сетью 150 через проводные, беспроводные и оптические средства связи.

При введении в эксплуатацию изобретения, серверы 120 связаны с поисковой системой 125, которую используют клиенты 110. Сервер 120 обходит, индексирует документы, сохраняет информацию, касающуюся документов, в специальном «хранилище» документов, которые были обойдены. Серверы 130 и 140 сохраняют документы, которые обходит сервер 120. Пока серверы 120-140 представлены как сообщества, существует возможность для одного или более серверов 120-140 выполнять одну или более функций других серверов 120-140. Например, два или более сервера 120-140 вводятся в эксплуатацию как один единый сервер. Существует возможность для одного или более серверов 120-140 начать действовать как два или более отдельных инструмента.

 

Типовая клиент/серверная архитектура

Рис. 2 — типовая диаграмма сообщества клиентов или серверов (далее сообщество клиентов/серверов), которая соответствует одному или более клиентам 110 и серверам 120-140 в соответствии с применением принципов, соответствующих изобретению. Модуль клиентов/серверов может включать канал передачи информации 210, процессор 220, основную оперативную память 230, память только для чтения (ROM) 240, блок памяти 250, одно или более устройство для вывода данных 270, коммуникационный интерфейс 280. Канал передачи информации 210 включает один или более проводник, который обеспечивает коммуникацию между компонентами сообщества клиентов/серверов.

Процессор 220 включает один или более процессоров обычного типа или микропроцессоров, которые обрабатывают и выполняют указания. Основная оперативная память 230 может включать в себя память с прямой выборкой (RAM) или другой тип динамического блока памяти, который хранит информацию и инструкцию по применению процессора 220. ROM 240 может включать ROM обычного типа или другой тип статического блока памяти, который хранит статическую информацию и указания по применению процессора 220. Блок памяти 250 включает магнитный носитель информации и соответствующий накопитель информации.

Устройство(а) для ввода данных 260 включает один или более механизм обычного типа, который позволяет оператору вводить информацию в сообщество клиентов/серверов, например, клавиатура, мышь, биометрические механизмы и др. Устройство(а) для вывода данных включает один или более механизм обычного типа, который передаёт информацию оператору, а также на дисплей, принтер, спикер и т.д. Коммуникационный интерфейс 280 включает в себя механизм-трансивер, который позволяет сообществу клиентов/серверов вступать в контакт с различными устройствами или системами. Например, коммуникационный интерфейс 280 включает механизмы, позволяющие вступать в контакт с другими устройствами или системами через сеть, например, сеть 150.

Как будет описано ниже, сообщество клиентов/серверов, удовлетворяющее принципам изобретения, выполняет определенные поисковые операции. Сообщества клиентов/серверов выполняют эти операции в соответствии с инструкциями программного обеспечения процессора 220, которые содержатся в памяти 230. Вычислительная среда может быть определена как логическое или физическое устройство памяти.

Указания программного обеспечения могут читаться в памяти 230 с другой вычислительной среды, например, с устройства хранения данных 250 или с другого устройства через коммуникационный интерфейс 280. Указания программного обеспечения, содержащиеся в памяти 230, могут вызвать процессы в процессоре 220, которые будут описаны ниже. Реализация принципов изобретения не ограничивается специфической комбинацией схем и программного обеспечения.

 

Типовая поисковая система

Рис. 3 — типовая функциональная структурная схема поисковой системы 125, удовлетворяющей принципам изобретения. Поисковая система 125 включает адрес документа, временной компонент 320 и оценочный компонент 330. Как показано на рис. 3, один или более адресов документа 310 и исторический компонент 320 включают информацию, относящуюся к документам, которые были обойдены, проиндексированы и сохранены, например, в базе данных, доступных с помощью поисковой системы 125. Временные данные, как будет описано чуть ниже, связаны с каждым документом в своде документов 340. Такие временные данные сохраняются в своде документов 340 либо где-то еще.

База документов 310 идентифицирует блок документов, контент которых удовлетворяет поисковому запросу. База документа 310 первоначально включает документы из свода документов 340, сравнивая термины в поисковых запросах пользователей с информацией, содержащейся в своде документов. В целом, процессы индексации документов и поиска уже проиндексированных документов, которые содержат поисковые термины, хорошо известны. Поэтому функциональное назначение базы документов 310 подробно не описывается.

Временной компонент 320 собирает временные данные, касающиеся документов в своде документов 340. При реализации принципов изобретения, временные данные включают информацию, касающуюся даты создания документа, изменений в документе, анализа запросов, ссылочного текста (например, текст, который содержит гиперссылку, обычно ярко выделенную в документе), информацию о трафике, поведении пользователей, а также информацию, собранную пользователями. Различные типы временных данных дополнительно описаны ниже. Помимо этого, временные данные включают дополнительную информацию.

Компонент ранжирования 330 определяет показатели ранжирования (одного или более документов в своде документов 340). Компонент ранжирования 330 определяет показатели ранжирования как в зависимости, так и вне от поискового запроса. Когда документы ассоциируются с определённым поисковым запросом (например, документ идентифицирован как релевантный определённому поисковому запросу), поисковая система 125 сортирует документы на основе показателей ранжирования и возвращает отсортированные документы пользователю, который сделал соответствующий запрос. С учетом аспектов изобретения, показатели ранжирования — показатели, которые способствуют качественной и количественной оценке документов. При реализации принципов изобретения показатели ранжирования базируются, по крайней мере, частично на исторической информации, полученной от исторического компонента 320.

>> 3.4 Типы временных данных

 

как продавать трафик | полезные скрипты | технические вопросы

вопросы хостинга | продвижение сайтов | поисковые системы