2.3.2. Поиск информационных ресурсов
вать. река ручьями, и благодаря их
94
і: .' ray сегодня в Интернете уже около двух милли
ардов
В результате имеющихся в Сети ресурсов
стала ?-?срьезноа проблемой.
Несмотря на то. чго ею занимаются тысячи проблема не только не приближает-к но и становится Процент
ройаїшь;?.. (или ііііЛїі'К'.'іірсзаііііьіх; ресурсов неуклонно падает. В последние два года это падение стало
Вывод простой; пространство Web быстрее чем К сожалению, у нас нет оснований пред-
лолнгатъ. что в ближайшее время что-нибудь может измениться к В итоге полек информации в Wide Web мож
но самой трудной задачей в Интернете. Если вы под
ключились к Сети с не пожалейте вре
мени дли решения этой задачи.
Поисяойые системы Интернета
Поисковые каталоги
Взгляните на книгу. начинается с и
Несмотря на то. что
они расположены в разных местах книг и выглядят совершенно по-разному, задача у них одна: помочь найти в книге имен- тот раз л ел. который в данный момеш нужен.
Содержание - это пример выби-
тему, которая ему ин и по пей находит номер стра-
пины. где гл'й. Vсш раскрывается. Алфавитный указа тел ь. - пример индексации (по-английски index - это и есть Читатель находит в указателе нужный термин и получает номер на которой он
В Интернете каталоги и указатели различаются технологией подготовки. Над каталогами работают а .р^ійтїііїк- формируются автоматически. При каталогизации ресурса окі.і ! jbiii редактор внимательно кросмагр^ае') ею. определяет, к какой области знаний относится данный рссу я". устанавливает его категорию в этой отрасли и вносит в каталог.
Самый крупный каталог Интернета - Yahoo yahoo.com).
В нем работают более 150 квалифицированных редакторов. Это большая но и ее усилий хватает95 лишь на то, чтобы поддерживать каталог на уровне одного миллиона ресурсов. Дальнейшее расширение сдерживается необходимостью поддерживать уровень актуальности. Сегодня редакторы Yahoo іі'иїяїім не столько наполнением каталога новыми сколько проверкой актуальности
ранее.
В российской части тоже есть несколько ката
логов. В недавнем прошлом лучшим считался каталог ' W ^ W .ЛЇГІІ5.Ї1.1І. но в последний год он заметно ровался, поменял направленность и сейчас представляет не столько каталог, сколько группу тематических собранных под одним доменным именем и посвященных обществу, музыке, спорту, и т. д.
Лишь в категории "Интернет" @Rus продолжает оставаться полноценным каталогом с базой данных среднего размера (порядка 10 тыс. о.асенф!ішіров;іиньії- ссылок). Ведущим же каталогом России в настоящее время стал ресурс ""List.Huf (www.list.ru). Его активы примерно !ГС тыс. ссылок, кла.ссоф;;- аяроз^ннлх по 18 категориям (Автомобили, Вокруг света. Отдых, Образование и наука и т. д.). С большим отставанием за ним следуют еще два тгатажнж "Созвездие Интернет" (www.stars.ru) и "Russia on the Neiv (www.ru). Их активы примерно равнозначны и составляют 35 - тыс. ссылок, но активы "Созвездия" выглядят более актуальными.
П он с кч^иые указатели
Поисковые указатели это автоматизированные системы. Они способны без участия человека, и пото
му их знание о подлинных ресурсах Сети намного (на несколько порядков) больше. Количество І!рО!'!ГДЄКЄИрОВЙПіЧЬТХ Web- страниц может измеряться сотнями миллионов.
Работа поискового происходит в три этапа, из
которых два первых и незамет
ны для пользователя. Сначала поисковый указатель собирает икфо^иа^-го из World Wide Web. Для этого используют специальные программы, броузерам. Они способны скопировать заданную Web-страницу на сервер поискового указателя, просмотреть ее, найти все которые на ней имеются, перейти по в них адресам, вать те ресурсы, которые найдены там, снова разыскать имеющиеся в них гиперссылки и т.
л.96
Подобные программы называют пауками, гу-
и другими подобными именами. Каждый поисковый этой цели свою уникальную программу, которую нередко сам и рабатывает. по исковые из проектов, с разработкой и внедрением автоматических программ, занимающихся мониторингом Сети.
Теоретически при yjit'HiOM входе с.'ы/'с^г.пгсобсн прочесать все Web-пространство за одно погружение, но на это надо очень много а ему еще периодически воз-
чраша і ься к ранее посещенным ресурсам, чтоб;:; контролировать происходящие там изменения и выявлять "мертвые", т.
ссылки. Неактуальными называют ресурсы, которые по каким-то причинам перестали вать (или изменили местоположение), хотя гиперссылки, имеющиеся в других продолжают па них При использоааиии "мертвых" гиперссылок мы получаем сообщение от броузера о том, что ресурс не найден.
После копирования разысканных Web-ресурсов на сервер поисковой системы начинается второй уі. ап работы - индекса- [(!!;;. В ходе !!ЦД?!КЄаі(ї!(і СОПЬЮТСЯ специальные базы ДаіііШХ. с ііо\:оїі.еьіо которых можно установить, где и когда в Интернете встречалось то или иное слово. что индексирован
ная база данных - это своего рода словарь. Она необходима для того, чтобы поисковая система могла очень быстро отвечать на запросы Современные системы способны выдавать ответы за доли селуш;ьз, но если не подготовить индексы заранее, то обработка одного запроса продолжаться
На третьем этапе происходит обрабо запроса клиента и выдача ему результатов поиска в виде
Допустим, клиент где в имеются Web-
страницы, на которых упоминается голландский
.механик, оптик и математик Христиан Гюйгенс. Он вводит слово Гюйгенс в поле слов и нажимает кнопку "Найти" (Search). По своим базам указателей поисковая система в доли секунды разыскивает подходящие Web-ресурсы и формирует результатов поиска, на которой
4 737 ции в Далее клиент может
пользоваться этими ссылками для перехода к интересующим его
Все это выглядит достаточно просто, но на самом деле здесь есть проблемы. проблема Современного Интернега
связана с изобилием Достаточно ввести в ноле
поиска такое простое как, "футбол", и рос
сийская поисковая система несколько тысяч ссылок,
сгруш'Ш.рс-вав их по 10 - 20 штук на отображаемой странице.
Несколько тысяч - это еще не так много, потому что поисковая система в аналогичной бы сотни тысяч ссылок.
] lonpoiiyліте найти среди них нужную! Впрочем, для рядового потребителя совершенно все равно, выдадут ему тысячу поиска или миллион. Как правило, клиенты просматривают не более 50 ссылок, стоящих первыми, и что там делается мало кого беспокоит.Однако клиентов очень и очень беспокоит качество самых первых ссылок. Клиенты не любят, когда в первом десятке встречаются ссылки, утратившие актуальность, их раздражает, когда подряд идут ссылки на соседние файлы одного и того же сервера. Самый же плохой когда подряд идут несколь
ко ссылок, к одному и тому же ресурсу, но находяще
муся на разных серверах.
Клиент вправе ожидать, что самыми первыми будут стоять наиболее ссылки. Вот здесь и возникает проблема. Человек легко отличает полезный ресурс от бесполезного, но как объяснить это программе?! Поэтому лучшие поисковые системы проявляют чудеса искусственного интеллекта в попытке отсортировать найденные по качественности их ресурсов. И делать это они должны быстро - клиент не любит ждать,
Строго говоря, все поисковые системы черпают исходную информацию из одного и того же поэтому
исходные базы данных у них могут быть относительно похожи. И лишь на третьем этапе, при выдаче результатов поиска, каждая поисковая система начинает свои лучшие
(или худшие) ;! ИЛ UB^J у. -.Л!> ччерты.
Операция сортировки полученных результатов называется ранжированием. Каждой найденной Web-странице система
98
присваивает какой-то рейтинг, который должен офажать качество материала. Но - понятие а программе нужны объективные критерии, которые выразить пригодными для сравнения.
Высокие рейтинги получают у которых
ключевое слово, использованное в запросе, в заголо
вок. Уровень реі;т;шіповышается, если это слово встречается на Web-странице несколько раз, но не слишком часто. Благоприятно влияет на реї-лгмтіт вхождение пу>: ко г о слова в первые 5 -- 6 «балдея текста, так как они считаются самыми важными при индексации.
По этой причине опытные Web-мастера давать в
своих страниц таблицы.
Для поисковой системы каж- .«І&5 ячейка таблицы выглядит как абзац, и потому основной содержательный текст как бы далеко отодвигается назад ; :-.;о! я на экране это и незаметно) и перестает ь решающую роль для поисковой системы.Очень хорошо, если ключевые с.'іОііз, использованные в запросе, входят в альтернативный текст, сопровождающий Для поисковой системы это верный признак того, что данная страница точно солп'^егстзу.-л запросу. Еще одним качества Web-страницы является тот факт, что на нее есть ссылки с каких-то других W„4'i-c; ;ч >;ні;. Чем их больше, тем лучше. Значит, а популярна и облада- высоким показателем совершенные поисковые системы следят за уровнем цитирования рированных ими Web-cipaiijii!. и учитывают его при ранжирований.
Создатели Web-страниц всегда в том, что
бы их просматривало больше людей, поэтому они готовят страницы так. поисковые системы давали им
высокий рейтинг. Хорошая, грамотная рйоотц Web-мастера способна значительно полин іпосещаемость Web-страницы, однако есть и такие "w.-m лор.1-.' которые пытаются Ызжиутл поисковые системы и придать своим Web-страницам ji-na
которой в них на самом деле нет. Они многократно повторяют на какие-то слова или группы слов, а для того чтобы те не попадались на глаза читателю, либо делают их исключительно мелким і.і!рі'.ф] о м. либо применяют цвет
99 текста, совпадающий с цветом фона. За такие "хитрости" поисковая система может и ей штрафной отрицательный рейтинг.
В последние годы сложилась и практика коммерческого В этом случае система дает более вы
сокий рейтинг тем Web-страницам, которые их зап
латил. Невзирая на очевидную субъективность такого подхода, в нем есть определенный смысл тех, кто ишет информацию в Интернете по словам. Например, если кли
ент ввел в поле поиска слово "автомобиль" или "сантехника", то можно предположить, что он хочет приобрести либо машину, либо смеситель для мойки. В этом случае ему не нужны романы из жизни сантехников, как не нужны и рассуждения об управлении автомобилем.
Почему бы на первом месте среди результатов поиска не дать ему адреса известных торговых фирм?Необходимость в ранжировании результатов поиска видна. Без этого клиенты захлебнулись бы в потоке предлагаемых ссылок и. можетры так никогда и недобрались до самых полезных для себя ресурсов. Однако у ранжирования есть и негативная сторона. У каждой поисковой системы своя политика ранжирования, и не исключено, что взгляды создателей поисковой системы не вполне совпадают со взглядами клиента. Очень может быть и так, что до каких-то ценных для себя ресурсов клиент никогда и не доберется, что по результатам ранжирования они всегда отодвигаться глубоко вниз.
Из этого можно -
Во-первых, *п'нр-д.й;есл избегать прямолинейного поиска по одному слову. Дайте поисковой системе группу ключевых слов, а еще лучше - фразу. -
Для поиска по группе слов или по ключевой і^я.® используйте не какую попало поисковую систему, а ту, к которой наиболее привыкли. В разных системах используются разные правила для записи г руциь; слов, и эти правила надо знать этом мы поговорим ниже). -
Если пользуетесь поиском по- одному слову, то, наоборот, применяйте как можно больше разных поисковых систем. То, что они используют разные алгоритмы рейтингова- ния, нам на пользу --да*,:-: шанс не пропустить, какой-то значимый ресурс.
[00
Краткий обзор поисковых укозоон'лой России За рубежом возникновение первых поисковых указателей относится к і \N-i- ? v,:i5 гг., а в России -к і ; .)97 гг. Поскольку в России объем Web-ресурсов составляет лишь несколько процентов от российским поисковым системам работа много проще, чем западным. они оснащены самыми современными средствами, уровню 2000 года, а общий размер Рунета (российского сектора Интернета) сегодня примерно таксю. каким был .шгиадкый сектор в 1994— гг. Поэтому сегодня в России особых проблем с поиском HlifjlopNUUiiHl нет и в ближайшее время они не предвидятся, А в западном секторе проблемы с поиском очень большие, и разные поисковые системы пытаются по-разному их преодолеть. О том. как Э'гс- происходит, и расскажем.
Из поисковых указателей в России сегодня действуют три главных (есть и более мелкие системы, но мы останавливаться на них не 5у&ем) Это "Рамблер" (www.raitiblilUu), "Яндекс" (www.yandex.ru) и "Апорт 2000" {www.aport.ru).
Исторически наиболее популярной поисковой системой "Рамблер". Она начала раньше других и
долгое гііх'у;я лидировала по размеру поискового указателя и кзчесі ay услуг поиска. Увы. сегодня эти достижения в пропилом. Несмотря на то, что размер поискового указателя примерно равен 12 миллионам Web-страниц, он давно толком не обновлялся и выдает устаревшие результаты.
Сегодня о популярный портал, лучшая в Рос-
система (о том, что это такое, мы расскажем ниже) плюс рекламная Традиционно эта система держит первое место в России по посещаемости и имеет хорошие доходы от Но в развитие поиска деньги, как мы покажем ниже, не а^алы-лакМ лт
Самый большой указатель лежит в основе системы "Яндекс" - примерно 27 миллионов Web-страниц, но дело не только в размере. Это не просто указатель на ресурсы, а указатель на самые актуальные ресурсы.
Система выигрывает на третьем этапе - в момент
представления информации клиенту. Она не с фсм;п ся к созданию самого большого указателя ав оматическими средствами, а вместо этого широко использует информацию из каталога
103 проходящую ручную обработку. Поэтому система выдает не так много как ближайшие но зато эти р^у^ьтать,:.. как яіі:рі'=. точны и наглядно представлены.
/учішкиі обзор і!Ь'\ поисковых ука-ціпюіси
За рубежом поисковых указателей гор;! сю больше. Если брать только круг, ней ил re. то насчитать около двух де
сятков. Мы в нашем обзоре на трех.
Наиболее популярной < ілл лтл. совершенно незаслуженно, как мы покажем далее) сли^те;; поисковая система л їй і Vista '. -vy. .uh;n ої;>.сот;. Она была одной из первых и лри ее красивом названии долгое в лидерах. К сожалению, сегодня неї никаких чтобы пользоваться ее услугами. Рано проведя зкл.полпрофиле. А'иа настоящее время вынуждена больше об интересах чем о развитии. Для нас с вами это означает, что индексацию новых ресурсов система тормозит, причем принудительно, а обновлением старых ресурсов не занимается. Ее указатели
а изобилие рекламных баннеров на страницах поиска никак не способствует скорости работы.
Самой мощной в сегодня является поисковая система Fast (www.alltheueb.com). О ней мало кто знает, потому что она была открыта сравнительно недавно (летом 1999 года). Создатели системы поставили перед ней глобальную цель - создать самый крупный и самый быстрый указатель в мире. Эта цель была достигнута в считанные месяцы. Система первой взяла 300-миллионный рубеж всего через четыре месяца после начала а в 2000 г. к отметке 600 миллионов Web-страниц. При этом скорость поиска системы составляет доли секунды и нет никакой рекламы.
Из множества прочих мы специально систему
Northern Light Она имеет приличный
указатель, лр;:олпА:;і.к>щні;оі к 300 миллионам Web-страниц, и предпринимает заметные усилия по поддержанию его актуальности. Эта система идеальна для проведения научных иссле- благодаря тому ч о сочетает индексацию и каталоги- ЖДОй&й, После поиска по ключевым словам система не только выдает обширные списки ссылок на найденные ресурсы, но и
102
формирует набор лапок, в которых поиска распо-
отдельным того, в системе
специальный раздел типа, называется
SpecialEditions. і >іі ведется вручную, и в нем можно найти готовые подборки материалов по актуальным ц^йбязйіш..
В системе имеется и небольшой
поставляются за деньги. Впрочем. раздел невелик и не портит систему.
По-видимому, он рассчитан на которым могут
срочно потребоваться справки по темам.
Проверка и выъф поискового указателя
Конкретные по выбору поискового указа
теля очень оыстро стареют. Ситуация Интернеге меняется буквально на глазах. Не проходит и полугода, чтобы что-нибудь не изменилось и в поисковых системах. Та система, которая была наилучшей вчера, может быть не самой лучшей и
очень плохой завтра. В го же время популярность - вещь хитрая. Она трудно но потом и долго живет. В итоге мы очень часто встречаемся ситуацией, когда самой популярной является далеко не лучшая система.
Мы поможем читателю научиться Г;З.МОС'ГЙ:з;'ГШ):іііН.Ц проверять разные поисковые системы и выбирать для работы те, которые дают лучшие результаты. При проверке размер поискового указателя не имеет решающего значения. Нам ведь нужны не миллионы ссылок, а две-три, но желательно самые лучшие. Поэтому важно не только то, как много Web-странол а поисковая система, но и то, когда она это делала в последний раз, как часто потом проверяла актуальное і і, ссылок и насколько корректно результаты поиска.
Чтобы проверить качество работы поисковой системы, надо дать ей задание на розыск сведений, о которых устаревшая система знать не может. Вот тут-то и проявится гниль тех систем, которые когда-то паї рсолп горы материала, а теперь
обновляют его и клиентам старье, густо
рив рекламой.
Давайте икс^ш^с такой опыт. мы узнали, что
в течение последних месяцев 2000 СЗД:* мир хо-
] J дом выборов США. Попройуом заказать в разных
системах поиск в содержат
ся три слова: Буш, Гор и выборы. Вот что он дает: "Рамблер""-- 45 документов; 'т^яарт1' - 3338 документов; "Яндекс" - 17 036 документов.
В том, что "Апорт" отстает от "Яндекса", нет ничего удивительного, ведь "Апорт" никогда не стремился к механическому увеличению размеров Его сильная сторона - качественный отбор. Но нельзя не обратить внимание на "Рамблера", нмеюшетс внушительный указатель, который всего лишь в два раза меньше указателя "Яндекса". Этот нехитрый эксперимент говорит о том, что как поисковая система свое развитие и, по-видимому, сосредоточивается на чем-то другом.
Такой же опыт можно поставить и за Мы, на
пример. разыскиваем VVeb-e і раї і s ніш. на которых упоминается операционная система с Microsoft
Whistler. К моменту написания этой книги она еще не существовала в Те поисковые системы, которые плохо обновляют указатели, неминуемо себя на этом задании.
Ключевые слова Поисковая система
+Mkrosoft +Whistler Mia . : (230 млн) 2800
Microsoft Whistler Northern Light . 000
Microsoft \\ Fast Search (580 млн) 26900
Как две самые современные системы Northern Light
и Fast S, (,rfh различаются по результатам примерно так же, как различаются размеры их указателей. Результат, выдаваемый системой Vista, заметно хуже. А теперь сами назовите слово, Aim Уі^ол если свежей информации в нем в пять раз меньше, чем в Northern Light. Заметим также, что выдача результатов в системе происходит очень медленно.
Классификационно-рейтин&овыё системы
Строго эти системы не являются но
если надо найти "то, не ими удобно пользоваться.
Клиентов WWW условно можно разделить -пич, и с.\ч
104
никое. Турист Г:і і: і , где ему ные и получает больше
от самого факта своего путешествия. чем от его ргту.тьг.пое. Охотник же ВЫХОДИТ в Ccrs-rja. чем-то конкретным. 'Ul^f-" в России в и летних сессии толпы охотни
ков отправляются в з^лоыедиикл. где водятся студенческие рефераты. В эти периоды поисковые системы отмечают резкое увеличение ключевого слова реферат.
На след "дичи" охотники выходят с помощью поисковых о'дтеи. а классификационно-рейтинговыми системами часто пользуются туристы. Самый крупный классификатор в России - "Рамблер Тор 100" размещается на портале "Рамблер" Классификатор похож на хйт^ог.. но в отличие от каталога перед ним не ставится задача собрать как можно больше информации о ресурсах Сети.
По каждой из кагсгоунл, одні ил;; в классификатор, представляются лучшие сайтм. а дальше работает счетчик. Чем больше посетителей обращаются к конкретному длг;у, тем выше показания с:сі чіік;; Те. кто вышел в Сеть без серьезных намерений, но с общим желанием отдохнуть и познакомиться, например, с музыкальными новинками, могут;л.іл jc; ъ. какие сайты в этой области посещаются чаще других и. соответственно, ї'.йЧй'П-; ґдлх. путешествие именно с них.
Upvc-мь поиска информации
Рассказывать о том, как пользоваться поисковыми каталогами, нет никакой необходимости. Надо просто зайти на сайт (адреса мы уже дали), выбрать категорию, которая в ней выбрать раздел, и гак дй.ж^, пока не откроется список конкретных ссылок. Точно так же работают и с только там против каждой ссылки на сайт имеется число, показывающее, человек воспользовались этим адресом в последние сутки (в последний час. в последнюю неделю).
Значительно интереснее рассмотреть приемы использования поисковых указателей, тем более что для разных указателей эти приемы разные. Но прежде чем приступать к изучению конкретных систем, давайте рш*. общие концепции,
равно относящиеся ко всем поисковым указателям.
Все поисковые указатели реализуют несколько алгоритмов поиска: простой, контекстный и споапи.^пый.
105 Простой поиск. При простом поиске в поле запроса ся одно или несколько оз.. которые могут характеризовать содержание документа. Если это слово то, как в ответ выдается большое ссылок, с которым но ч делать. Если несколько то зависит от того, как эти слова введены, а это, в свою очередь, зави- от конкретной ПСПО. С\ifi~i системы. Приемы простою поиска в разных поисковых как правило, свои, и прежде чем ими пользоваться, желательно почитать инструкцию.
Расширенный поиск. Расширенный поиск всегда подразумевает запрос из группы слов. Пра расширенном isohcко в большинстве случаев разрешается связывать ключевые слова логическими операторами AND OR (ИЛИ), NOT ? и другими. Основное достоинство расширенного поиска состоит в том. что, как правило, записи ключевых слов и логических операторов в разных системах либо одинаковы, либо очень жи. Поэтому, усвоив один раз приемы расширенного поиска, можно ими пользоваться где угодно. Надо только предварительно переключить систему в нужный режим
поиск. Это очень полезный вид поиска, кок сожалению, реализован не во всех 1елях. которые его следует
особо. При контекстном поиске требуется точное совпадение фразы или группы слов, например: Все смешалось в доме Облонских. В большинстве включающих этот метод, ключевая фраза.должна быть заключена в кавычки: «Все смешалось в доме Облонских».
поиск. С помощью команд специального поиска разыскиваютдопсл^н.о^ачас информацию. Такие команды, : ? а.;-:: '-. а. позволяют определить, как чисто а Сети чаются на какой-либо ркс^с, с их
помощью можно найти ключевые входящие в заголов
ки Web-страниц и т. п. Как правило, поиска в различных поисковых системах свои.
Поисковые системы и каталоги ресурсов "Желтые страницы Internet" издательства "Питер"
каталог ресурсов российского содержащий
ванные использованием многоуров- i-aauii а классификатора) краткие описания тысяч российских.
русскоязычных и к России
?того электронного каталога является
яся база данных начало которой было n0."!0*v!:'.'
при подготовке справочников "Желтые страивіщі Ifitern^L Русские ресурсы".
и ww.piter-pre s.ru
-с іііісїі(ч'-ч(!Н(. г|)'4 российских w"w'tv-c€3Ee;}OB Данный сайт содержит поис
ка в российского Интернета.
t
AliiiS - Search Manager
На она содержит следующие разделы:
"Поисковые системы". "Каталоги j^yptgarfc"'. "Информационные серверы", "On-line Библиотеки", "Файлы и программы", "Picture; & Photos". "Cracks & Serial Numbers".
www. alius, m/search
EuroStck - "Поиск Европа"
Международная поисковая система EuroSeek, щая на роль ведущей системы поиска ліп^рноі -ресурсов в Европе, позволяет выбрать язык интерфейса, раничить поиск регионом или документами на заданном языке. Предлагается выбор из 4v европейских языков (в их число входит и русский). Каталог ресурсов по темам: "Бизнес", "Домашнее", "Игры". "Здоровье". "Искусство". "Компьютеры", "Наука". "Новости". "Образование", "Общество", "Отдых". "Покупки". "СМИ". "Спорт", "Справочники", "Страны и регионы", "Техника",
"Увлечения'; . ,
www.euroseek.nel/page
FileSearch.ru
FileSearch.ru - • это поисковая система, поиск среди миллионов файлов, собранных практически со всех Российских FTP есриеров и нескольких тысяч СЦЩ рОБ по всему миру. База поиска постоянно обновляется (не реже одного раза в 5 дней), а неработающие ссылки удаляются.
т
Global Search
Вам пре "тавляется возможность искать информацию в используя с. дповременно ресурсы основных поисковых машин и каталогов.
/та. wcbservis.ru
107 База лаклых a ір^сив j.h-m ршишн почты (Intel-map)
База л.; иных. первая версия которой разработана еще в
г., сейчас предоставляет возможность удаленного доступа через Интернет. Telnet и E-mail. В записях базы данных хранится информация об имени пользователя, электронном ал рек. организации и почтовом адресе. Система Intermap просматривает базу данных в поиске записей, содержащих в своих полях образцы запроса (например, мент имени или
домена). Способ пополнения базы не указан. Вероятно, сбор информации происходит автоматически на основании анализа заголовков писем в телеконференциях и списках рассылки.
WH4V. botik.ru/intermap
Rambler
Поисковая сш:гема содержит информацию о более чем 12
млн. документов, расположенных на серверах России и стран СНГ-
rambler,
Rambler
Страница для поиска в системе Rambler с учетом морфологии русского языка на основе технологии Япаох фирмы CompTek і шєїТій ? і она і .
tru'H'. comptek. ти/татЬ.ktml
RnsNews
- русский поисковый сервер по телеконференциям, появившийся в 1997 г. Сервер является функциональным аналогом американского сервера и предназначен для поиска по архивам статей русскоязычной части всемирной системы непрерывно пополняется, срок статей - полгода (планируется увеличение до года).
Имеется список всех статьи которых за
носятся в базу данных. Поддерживается развитый язык запросов, предусматривающий логические операторы и символы под- "векторные указание статей (раз
мер, время создания и т. п.). Возможен простой и расширенный с краткой и подробной выдачей Просмотр
статей возможен как через так и с помощью
программы чтения Создание сервера финан-
фирмой Corvis Ltd.
news.corvu.ru
108
Search.da.ru. Система поиска в
Система ищет запрошенную информацию в нескольких самых известных каталогах русских ресурсов Интернета (stars.ru, Rambler's Тор 100. www.ru, @Rus, List.ru, Вы можете сами пометить те в которых надо ис
кать Web-сайты. выданные каждым из выбранных
группируются, после чего общий итог выводится на единой странице. Суммарный объем базы поиска - более і : тыс. аннотированных Web-сайтов и несколько миллионов 'Л ,; ? 11
? с/а, и
News. Телеконференции
Система TELA имеет часть, предназначенную для поиска по ключевым словам в русскоязычных телеконференциях: иерархии relcom, fido7, медицинские телеконференции ;пе Лих. ?vsvepCy^^s телеконференции группы spb и другие. Предусмотрен отдельный поиск в каждой из коммерческих телекон- фсрекцнй "Редком".
html
TELA T^toritsrn
Поисковая система TELA ориентирована на поиск русскоязычных страниц в Интернете, а также англоязычных страниц на российских серверах. Сбором страниц занимается подсис- г;':,'де р'лбот. сделанная на базе робота MOMspider, а поисковая часть сервера TELA создана на базе системы поиска с использованием русской версии системы поддержки морфологии языка (L:AS. Проиндексированные документы полностью хранятся на поисковом сервере и могут быть просмотрены, даже если сервер, с которого они получены, недоступен или документ удален.
tela. dux. ru
Каталог "Деловой Интернет"
Проект "Деловой Интернет" возник в 1998 г. и был призван аккумулировать информацию о ресурсах Интернета по экономике, финансам, менеджменту, маркетингу. В рамках ироек: j действует каталог ссылок на ресурсы Интернета. Развивается и раздел, содержащий аналитическую информацию, статьи по экономике, мснлджкслту.. маркетингу.
innc. delovoy. spb. г и
109 Каталог"Закладай"
Каталог содержит большое количество ссылок на ресурсы Интернета, разбитых на 10 больших категорий (Интернет, ин-
ф о р к а и и я, компьютер,
тересы, культура, знания, рынок, общество). Каждая категория имеет свои подкатегории.
Ut/; . ? ?
Г>5ш. тої рафнчіч'кан їипкіаіііан система "Букинист"
Поисковая система "Букинист" предназначена для поиска книг и других электронных текстов, имеющихся в свободном доступе в Интернете.
и ?
Географический индекс русских Web-серверов
Каталог русских -ресурсов, сгруппированных по
месту нахождения. Есть пометки о языке и кодировке представленной на сайтах информации.
www.spocc.n t/enghsh/spa cenet/sti/wwwlist.html
"Епрст!" Поисковая система
- это поисковая система с простым дружественным интерфейсом. Она позволяет пользователям максимально ^ЫО ! j м найти нужную информацию. В отличие отдру- гих систем регулярно обновляет ссылки и
liposoofii'T сайты на соответствие заявленным ключевым словам и темам. В время "Ei[реі:" объединяет почти 30 тыс. ссылок на различные ресурсы. Разумно составленный каталог делает ;.*" идеальным посредником между теми, кто предоставляет и ищет информацию.
poisk. eprst. пШагек asp ?fiml-
Интерне r-ишенка
Поисковые машины, каталоги в. Поиск
программ. Поиск картинок.
nnm№$№ci.comsteuthtiQuna
Каталог -п Rus
ресурсов, база данных ресурсов российской части Интернета и зарубежных материалов имеющих отношение к России, по тематическим маршрутам.
h!1p://atrus.apart. ru
ІСаіалін "Закон и праві)"
Каталог поиска пра
вовой информации в Интернете. Ссылки на базы
110
данных по федеральные
власти, и ведомства. Просто полеллые
ссылки на правовые темы.
inn г. спаї, г и vtstatut
Kaik::nu "Иван Сусанин"
Новый, но уже довольно популярный каталог русских ресурсов Интернета. Составляется не робото;, а лллълл. кото-
отбирают наиболее интересные сайты в Сети и делают к ним «нотации.
onwm. іvpius,net/susamn
Каталог "И нтернет-исгория'1
Каталог ссылок на русскоязычные исторические ресурсы в Интернете. Исторический форум., форум обмена ссылками по истории для студентов и аспирантов, рефераты.
WBTte, chat.ru/~vwhistory
Каг^лог "Синдбад"
Каталог "Синдбад" разрабатывается в рамках проекта создания распределенного многоуровневого мультиязычного каталога Интернета с сетевой организацией данных
и является его составной частью. База данных распределенного каталога содержит около 3 млн. Интернет-ресурсов, объединенных в 15 тыс. разделов. В настоящее время в проект входят 5 каталогов, расположенных на трех сайтах.
www.chat.ru
Каталог "Улитка"
Этот каталог предлагает более 25 тыс. ссылок на ресурсы Интернета, сгруппированных е 22 рубриках, среди которых есть и оригинальная рубрика "Пиво". На сервере реализован поиск. Регулярно є6ья:й.їїя"т::?ї двадцатка лучших сайтов.
innc. idhr.u. ru/dt- h;u! asp
Каталог СІїаі.пі
Очень хороший каталог российских в.
Рубрикатор, аннотации.
catalog. ? їй! пі
Каталог List.ru
Один из самых русских каталогов Интернет-
ресурсов. Ссылки структурированы по темам. Рядом с нием сайта дается краткая аннотация и
I ние на (русский пли Возможна сортировка
по по
из каталога на сайт в течение пос
ледних 30 дней), по времени добавления.
Mwww.lisLru
Каталог Russia on the Net
Russia on the Net - это первый и наиболее широко из- каталог российских серверов и сетевых ресурсов, посвященных России. Каталог разбит на тематические разделы, в которые пользователи Интернета могут добавлять сведения 0
своих серверах и страничках. Каждый раздел содержит подборку адресов с краткими ашіотїїціїянм. Имеется возможность поиска по ключевым словам в описаниях и адресах ресурсов.
htm
Каталог Яііч:^. ш. Лица российских сайтов
дом ' -У ль: ус и московский Интернет-провайдер "Гамма" начали реализацию нового проекта под названием "Лица российских сайтов". В рамках этого проекта предусматривается создание регулярное обновление своеобразной галереи (альбома) российских сайтов, где каждый сайт представлен небольшой копией экранного вида титульной страницы вместе с именем домена и датой получения этого изображения. Когда готовился справочник. Web-альбом содержал около вто
рого уровня в домене Сайты сгруппированы в алфавитном 1
л іря чке, соответствующем именам доменов.
1VWW,Я! tes.ru
К-ліа.чії! научных ресурсов Интернета
Этот сайт посвящен научным исследованиям и вопросам образования. Кроме каталога научных в
содержится большое количество ссылок на университеты всего мира, здесь есть поисковая система, позволяющая вести поиск по всем наиболее эффективным по
исковым машинам России и дальнего зарубежья. Кроме того, в вы можете ознакомиться с научными публикаци
ями по темам и опубликовать свои а
обсудить вас с коллега
ми на
www.sergo.net
112
"Следопыт"
Интеллектуальная
в компании об-
на ^стйсгво^щйі русском или английском языке несколькими поисковыми пере
вод запросов с русского на английский и. поиск рус
ских и ашпипсмг-. слов во уьхл грамматических формах.
hltp//mv]r.niedinlingiw nt/\v\vu/u wwsearc.htm
?Сіфа^оі^к электронных адресов; С^кт-ПеЕгеб^рл
База данных, в которую вы можете добавить и свои адреса, предоставляет возможность поиска e-mail частных лик и
она пока еще
но неполная. Так, при поиске по фамилии "Иванов" база выдала всего четыре адреса. Организацию можно искать по названию и телефону этой по виду деятельности, по электронному адресу: частных лиц - по имени, телефону или электронному адресу.
h itp/Avwwspbmall. пі: 8 J On
Еще по теме 2.3.2. Поиск информационных ресурсов:
- 2.3. Ценности информационного общества
- 2.3. Ценности информационного общества
- Информационное обеспечение деятельности риэлторов
- 2.2. ИНФОРМАЦИОННО-БИБЛИОГРАФИЧЕСКИЕ РЕСУРСЫ
- 2.2.2. Э.-къпршпилс формы информационных ресурсов
- 2.3.2. Поиск информационных ресурсов
- Информационные ресурсы
- 5.4. Информационные ресурсы сети Internet
- ИНФОРМАЦИОННЫЕ ПОТРЕБНОСТИ - ПЕРВОПРИЧИНА ВОЗНИКНОВЕНИЯ И РАЗВИТИЯ БИБЛИОТЕКИ
- ТРАНСФОРМАЦИЯ БИБЛИОТЕК В ПЕРИОД ИНФОРМАЦИОННОЙ ТРАНСФОРМАЦИИ ОБЩЕСТВА
- ИНТЕРНЕТ-РЕСУРСЫ (сайты научно-популярных изданий и сетевых научных агентств)
- В поисках информационного повода
- 3.2. ИНФОРМАЦИОННЫЙ РЕСУРС ПОЛИТИЧЕСКОЙ ВЛАСТИ: ИСКУШЕНИЯ И РАЗОЧАРОВАНИЯ
- НА ПУТИ К ИНФОРМАЦИОННОМУ ОБЩЕСТВУ: ОПЫТ ЕВРОПЕЙСКОГО СОЮЗА, БЕЛАРУСИ И РОССИИ А.А. Лазаревич
- Угрозы (проблемы) информационного общества
- Информационные ресурсы
- 152. Глобальное информационное пространство