как заработать в интернете | полезные скрипты | технические вопросы

вопросы хостинга | продвижение сайтов | поисковые системы

История поисковых машин:
с 1945 года до Google 2006

Автор: Аарон Уолл
Источник: журнал «Продвижение сайтов», № 149
Русский перевод под ред. И. Гурова

Хотите узнать историю развития поисковых технологий начиная с 1945 до 2006? Если да, тогда просто продолжайте читать. Вот о чем я буду рассказывать.

 

Как мы можем думать (1945)

Идея гипертекста и увеличения памяти по-настоящему начала обсуждаться в июле 1945, когда была опубликована статья Ваннавера Буша «Как мы можем думать» в The Atlantic Monthly. Это произошло сразу после войны, на волне единения, которое тогда царило в научных кругах.

Ваннавер призывал ученых объединить свои усилия и создать единую базу знаний ради всего человечества. Вот несколько отрывков из его статьи.

Специализация становится все более необходимой для прогресса, попытки связать различные дисциплины становятся все более поверхностными.

Проблема заключается не в том, что появляется слишком много публикаций по самым разнообразным темам, а в том, что количество публикаций увеличивается со значительно большей скоростью, чем мы способны обработать и применить. Совокупность нашего опыта и знаний увеличивается чудовищными темпами, а средства, которыми мы пользуемся для нахождения нужной информации, напоминают те, которыми пользовались во времена парусных судов.

Любая информация, если она представляет ценность для науки, должна постоянно пополняться, она должна где-то сохраняться, и, прежде всего, она должна обсуждаться.

Ваннавер не только свято верил в идею хранения информации, но также считал, что если информация представляет ценность для человека, то она должна представлятся в таком виде, в каком это будет максимально удобно для него.

Наша неспособность эффективно работать с информацией проистекает из-за того, что системы, которыми мы пользуемся для обозначения этой информации (индексации), слишком искусственны... После того, как мы найдем первую часть информации, нам нужно проходить всю цепочку запросов снова, для того чтобы найти вторую часть.

Человеческий разум работает по-другому, он работает по принципу ассоциативной связи... Было бы глупо надеяться воспроизвести этот механизм искусственно полностью, но он может нас многому научить. Минимум, который можно из него извлечь, — это улучшение существующей системы.

Возможно, нам бы удалось приблизиться к пониманиманию человека, если бы нам удалось проанализировать его темное прошлое и настоящие проблемы более полно и объективно. Человечество построило настолько сложную цивилизацию, что логическим продолжением этого эксперимента было бы большая механизация областей связанных с хранением и работой с информацией.

Он также предложил идею системы для хранения и предоставления информации виртуально безграничной, быстрой, надежной, расширяемой и построенной на принципе ассоциативной связи.

 

Джерард Солтон (1960-1990)

Джерард Солтон (Gerard Salton), который умер 28 августа 1995 года, был отцом современных поисковых технологий. Под его руководством в Гарварде и Корнеле была разработана система работы с информацией под названием SMART (Salton's Magic Automatic Retriever of Text). Волшебная автоматическая система по обработке текста Солтона включала в себя такие важные концепты как векторная модель, обратная частота документа, частота употребления слова, параметры веса слова, механизмы обратной связи от релевантности результатов.

Он также является автором 56-страничной книги «Теория индексации», в которой рассказывает о большинстве своих экспериментов, и на положениях которой до сих пор строится работа большинства поисковых систем. Том Эвслин написал статью в своем блоге, в которой поделился своими впечатлениями о работе с мистером Солтоном.

 

Тэд Нельсон

Тед Нельсон основал проект Xanadu в 1960 году, а в 1963 году придумал гипертекст. Целью проекта Xanadu, было создание компьютерной сети с простым пользовательским интерфейсом, который бы решил многие социальные проблемы, такие, например, как атрибуция.

Хотя Тэд и был против сложного кода разметки, неработающих ссылок, и кучи других вопросов, связанных с HTML в его применении к WWW, именно его работа некоторым образом вдохновила идею и создание WWW.

До сих пор непонятно, почему проект Xanadu потерпел неудачу, так как он так и не был никогда запущен.

В Википедии есть специальная страница, посвященная мистеру Нельсону.

 

ARPANET (от англ. Advanced Research Projects Agency Network)

ARPANet — это сеть, которая стала предшественницей сети Интернет. В Википедии есть отличная страница, посвященная ARPANet, а на Google Video можно найти бесплатные и интересные материалы по этой теме.

 

Арчи (1990)

Первые сайты начали появляться в 1993 году, в большинстве это были сайты университетов, но задолго до того как появились они, появился «Арчи», так назывался первый созданный поисковик. Он появился в 1990 году, благодаря Алану Эмтагу, студенту университета МакГила в Монреале. Вначале проект хотели назвать «Архивы», но потом сократили до Арчи.

Арчи помог решить проблему поиска разбросанной по всей сети информации, комбинируя основанный на скрипте механизм сбора и выдачи данных по запросу, основываясь на совпадении в названиях файлов с поисковыми запросами. Арчи превратился в базу данных документов, в которой и производился поиск по запросам пользователей.

 

Veronica & Jughead

Новость о появлении Арчи распространялась из уст в уста, а потом и от компьютера к компьютеру. Он стал настолько популярным, что группа System Computing Services при университете Невады создала Veronica, которая служила тем же целям, что и Арчи, но осуществляла поиск по текстам документов в простом текстовом формате. Вскоре появился еще один интерфейс для поиска информации — Jughead, который служил тем же целям, что и Veronica. Они оба работали с документами, пересылаемыми через Gopher, который был создан как альтернатива «Арчи» Марком МакКахилом в университете Миннесоты в 1991 году.

 

Протокол передачи данных (File Transfer Protocol)

Тут, конечно же, не обошлось без Тима Бернерса-Ли, хотя тогда еще не существовало Всемирной Паутины. Основным способом предачи данных был File Transfer Protocol (FTP).

Если у вас был файл, которым вам хотелось поделиться с другими, нужно было установить FTP сервер. Если кому-либо нужно было скачать этот файл, он использовал FTP клиент. Это было достаточно эффективно в небольших группах, но чем больше информации накапливалось, тем более фрагментарной она становилась.

 

Тим Бернерс-Ли и WWW (1991)

С июня по декабрь он работал в Европейском совете по ядерным исследованиям (Conseil Europeen pour la Recherche Nucleaire, CERN) консультантом по программному обеспечению. Там же он предложил проект, основанный на идее гипертекста, чтобы исследователи могли получать информацию и делиться ей с другими. С помощью Роберта Кэлльо он создал прототип под названием Enquire.

Затем Бернерс-Ли покинул CERN и какое-то время работал в Image Computer Systems Ltd., а в 1984 году вернулся обратно. В 1989 году CERN располагала самой большой интрасетью в Европе, и Тим Берненс-Ли увидел в этом возможность связать гипертекст и интернет: «Мне всего лишь пришлось взять идею гипертекста и связать ее с идеями TCP и DNS и — да-да! — появилась Всемирная Сеть!» Он использовал ту же идею, что и при создании системы Enquire. Тим также создал первый в мире веб-браузер и одновременно редактор (под названием WorldWideWeb и разработанный с помощью NeXTSTEP), а также первый веб-сервер под названием httpd (сокращенное название от for HyperText Transfer Protocol daemon).

Первым сайтом Сети был info.cern.ch, в онлайне он появился 6 августа 1991 года. На нем была размещена информация о том, что такое всемирная паутина, как можно получить браузер и как установить веб сервер. Этот сайт является также первой директорией, так как Бернерс-Ли позднее стал размещать там ссылки на другие сайты.

В 1994 году Тим Бернерс-Ли основал Консорциум Всемирной Паутины (World Wide Web Consortium) в Массачусетском технологическом интституте.

Тим создал виртуальную библиотеку, которая является старейшим каталогом сети. А также написал книгу под названием «Плетя паутину» о том, как он создал интернет.

 

как заработать в интернете | полезные скрипты | технические вопросы

вопросы хостинга | продвижение сайтов | поисковые системы