17 июля 2019, среда, 17:26
VK.comFacebookTwitterTelegramInstagramYouTubeЯндекс.Дзен

НОВОСТИ

СТАТЬИ

PRO SCIENCE

МЕДЛЕННОЕ ЧТЕНИЕ

ЛЕКЦИИ

АВТОРЫ

09 августа 2010, 09:30

Шмуглы

 

Альтернативные поисковики

Нынешний поисковый гигант Google неуклонно рос с момента рождения (1998 г.), но теперь заговорили о том, что его доля стала сокращаться под напором конкурентов, которые тоже осваивают новые технологии и методы и набирают популярность. Недавно на сайте CNN Money опубликовали статью с подробным анализом того, кто и на каком основании конкурирует с Google и какие у этого могут быть последствия (пересказ статьи по-русски можно найти здесь). В числе его конкурентов, в частности, называют Apple с его операционной системой (iOS), гораздо более популярный, чем ее аналог Android, который теперь принадлежит Google; растущие социальные сети (прежде всего FaceBook) как более надежный и эксклюзивный источник информации; поисковики YahooBaidu и Microsoft Bing [1], которые по эффективности поиска уже мало уступают Google (а в России, скажем, Google заметно отстает от Яндекса).

Но помимо Google и его мейнстримных конкурентов, в сети есть масса так называемых «альтернативных» поисковиков, число которых неизменно растет. Среди них есть и коммерческие, и любительские, и исследовательские проекты. Каждый поисковик обычно специализируется на разработке какого-то определенного принципа.

«Нишевые» поисковики

По-английски их называют “niche search engines”, и это, пожалуй, самый распространенный тип поисковиков. Их задача в том, чтобы отбирать ссылки определенной тематики – например, только картинки (например, Picsearch), аудио (Poiskm) или видеозаписи (Blinx). Поиск текстовый: в строку вводятся ключевые слова, и система выдает подборку более или менее релевантных ответов. Специализаций существует множество: Technorati.com ищет по англоязычным блогам; FilesTube и DownloadAnyStuff ищут всё, что можно скачать; Scirus ищет размещенные в Интернете материалы научной тематики; Интернет-архив, появившийся в 1996 г., использует сервис WayBack, позволяющий смотреть, как выглядела та или иная страница в прошлом, даже если этой страницы больше нет.

Бывают совсем экзотические поисковики. Например, FindSounds специализируется на звуках (храп, коровье мычание, скрип двери и многое другое); ищет по английским, французским, немецким и испанским ключевикам. Наконец, встречаются устройства, которые показывают, какие из ближайших магазинов сейчас открыты, ищут цитаты и крылатые выражения и рецепты разных блюд.

Классифицирующие поисковики

Кластеризующие поисковые системы стали появляться с середины 2000-х гг. Это поисковики, которые выдают результаты, группируя их по темам. В 2005 г. в России появилась такая система – Nigma.ru. В ответ на запрос (например, «Полiт.UA») она выдает список тематических групп (в случае с Полiт.UA – «полiт», «политика», «публичные лекции», «Полит.ру», «Украина» и т.д.). Если выбрать одну из групп, откроется ряд подгрупп, которые тоже можно выбирать, уточняя таким образом подборку ссылок в соответствии с поисковым запросом. При этом она ищет как по собственной базе, так и с помощью крупных поисковиков. Немного раньше появился аналогичный американский поисковик Clusty, который потом переименовали в Yippy. В свое время о нем писали как о серьезном конкуренте Google (на том основании, что ранжирование страниц, благодаря которому Google стал поисковым гигантом, позволяет только отсеивать заведомо неинформативные рекламные сайты, а кластеризация подразумевает интеллектуальную обработку материала и тематический подбор). В 2006 г. появилась еще одна российская кластеризирующая система Quintura.

Мультимедийные поисковики

Год назад Google провел исследование, чтобы выяснить, чего хотят пользователи от современных поисковиков. Как и следовало ожидать, основная масса пожеланий свелась к тому, чтобы система читала мысли пользователя (а также понимала человеческую речь «на слух», угадывала настроение, говорила человеческим языком, оберегала детей от зла и т.п.). Так как технических средств, чтобы добиться всего этого сразу, не хватает, разработчики идут разными путями.

3D

Одно из направлений напрямую связано с расширением мультимедийных возможностей у современных компьютеров. С одной стороны, в сети становится всё больше аудио и видеофайлов, с другой стороны, у нынешних компьютеров появляются такие параметры, которые позволяют загружать тяжеловесные страницы с анимацией и 3D. В связи с этим, например, стали развиваться так называемые 3D поисковики, которые, правда, пока остаются в основном громоздкими системами с претензией на развлекательность. Таков, например, запущенный в 2008 г. проект ExitReality. ExitReality – это браузерный плагин, показывающий любой вебсайт в формате 3D, иными словами в виде помещения, по которому можно перемещаться в качестве аватара или без него, щелкать по ссылкам, просматривать видео (отображаются в виде изображения на теле/киноэкране) или картинки (размещенные на стенах). В качестве поисковика ExitReality специализируется на поиске 3D-контента: например, если там набрать «Paris» (по-русски система не понимает и кириллицу не распознает), то выпадут ссылки на 3D-симуляторы окрестностей Триумфальной арки, по которым опять же можно ходить в виде аватара. Зачем это нужно, не вполне ясно, из-за обилия расчетов страшно тормозят даже вполне быстрые компьютеры, и пользовательских симпатий система не завоевала. Те, кому нужен обширный 3D-чат с Триумфальной аркой и Красной площадью, видимо, обитают в сети Second Life, принцип которой проект ExitReality пытался применить к работе в Интернете.

Тем не менее, элементы 3D в оформлении поисковиков продолжают использовать. Такие системы становятся известными, прежде всего, благодаря своему внешнему виду и формату, в котором они выдают данные. Space Time 3D представляет собой скорее интерфейс поисковика. Результаты берутся из крупнейших поисковых систем (запросы можно делать только латиницей) и оформляются в виде скриншотов вебстраниц в разной степени удаленности от пользователя. Классификации страниц нет, релевантность весьма относительная, скорость очень низкая. Единственное достижение системы — необычный внешний вид и, действительно, своего рода 3D.

Еще один пример — поисковик изображений и видео (на основе результатов Google) SearchCube. Он выдает результаты в виде картинок, налепленных на грани куба, который можно вращать во все стороны и выбирать понравившиеся. Работает тоже довольно медленно и носит, по-видимому, развлекательный характер.

Нетекстовый поиск

Эти поисковики совершенно иного рода. Их разработчики пытаются создать систему, которая бы искала не по словам. У текстового поиска, при несомненных достоинствах, есть серьезные ограничения. Например, если нужно определить музыкальное произведение по мелодии (а иногда других данных нет), текстовый поиск не поможет. Обычно в таких случаях приходится обращаться к сообществу социальных сетей, что тоже не всегда эффективно. В качестве промежуточного варианта создаются специальные сообщества, где можно напеть/наиграть/загрузить мелодию, чтобы другие члены сообщества попытались определить, что это. В этом смысле наиболее прогрессивное решение предложил проект Musipedia (музыкальная энциклопедия, созданная по образцу Википедии). Этот поисковик позволяет вводить запрос в нескольких форматах — записать музыкальный фрагмент нотами, наиграть на флеш-пианино, напеть, выбить на клавиатуре ритм. Всё это можно сопровождать текстовыми дополнениями. Musipedia в основном использует собственную базу данных, пополняемую пользователями, а также ищет MIDI-файлы по сети. Эффективность поиска относительна. Musipedia хорошо, хотя и неидеально, находит академическую музыку, но пока доступные ей базы далеки от всеохватности.

Поисковики изображений ставят перед собой аналогичные задачи. Помимо текстового поиска, они предлагают пользователю загружать картинки со своего компьютера и ищут подобные им; предполагается, что таким образом удастся определить, что изображено на картинке. Поиск осуществляется примерно так же, как в случае с текстом. В тексте выделяются ключевые слова, в изображении — ключевые элементы (например, композиция, форма, цвет). В качестве примера можно привести такие системы, как TinEye.com, Sapir (довольно слабый поисковик, разработанный IBM) или отечественный Piccolator. Наконец, некоторые разработчики уделяют особое внимание поиску по загруженным видеофрагментам. Здесь дело осложняется тем, что нужно в сжатые сроки обрабатывать файлы очень большого размера. Таких поисковиков пока нет, зато есть несколько проектов. В 2009 г. в Интернете промелькнуло несколько статей о запуске инновационного проекта DIVAS, использовавшего метод идентификации видео по параметрам, которые называли «цифровыми отпечатками пальцев» (digital fingerprints). Но страницы с бета-версией уже не существует, а о проекте больше не говорят. Этот проект разрабатывался в рамках программы Европейской комиссии CORDIS, которая занимается IT-проектами. На сайте комиссии можно найти целый список проектов, развивающих технологии мультимедийного поиска.

Человеческий язык

Как показали данные опроса Google, потребность в голосовом общении с поисковиками у пользователей есть. В сети пока практически нет поисковых систем, которые бы отзывались на человеческий голос. В принципе, такую возможность предполагает экспериментальный поисковик Voccal, но чтобы вступить с ним в устное взаимодействие (по-английски), нужно сначала договориться с операционной системой на своем компьютере и настроить в ней расшифровку речи, если это предусмотрено. Более серьезные шаги в этом направлении предпринимает Google, который открыл бета-версию сервиса GOOG-411, позволяющий американским пользователям связаться с поисковой системой с помощью мобильного телефона.

Но распознавания речи и реагирования на ключевые слова еще недостаточно: в идеале система должна разговаривать с пользователем, задавать ему уточняющие вопросы, понимать, в каком смысле он употребляет слова. Этим занимаются разработчики многочисленных «интеллектуальных» поисковиков, ставящие себе задачей обучить машину так, чтобы она учитывала человеческий фактор.

Среди таких разработок выделяется целая категория систем, специализирующихся на разговоре с пользователем (по-английски это называется natural language search engines). Одной из первых попыток стала система Ask.com (есть русскоязычный вариант, но возможностей у него гораздо меньше), которая, с одной стороны, может искать по ключевым словам (с тематической группировкой результатов), а с другой стороны, умеет отвечать на обычные вопросы (например, «Который час?» - здесь она попросит уточнить, где пользователь находится).

Поисковик Lexxe.com тоже отзывается на некоторые вопросы. Если его о чем-нибудь спросить, он сначала выдаст собственный ответ (да/нет/краткую информационную справку), а ниже покажет результаты поиска. Некоторые ответы, правда, иногда далеки от истины. Например, на вопрос «Do you speak Russian?» система отвечает “Yes”, но на русскоязычные запросы, тем не менее, не реагирует.

Забавный поисковик START, созданный в Массачусетском технологическом университете, скорее похож на виртуального бота-собеседника, но заточен именно под информационные запросы. При этом его задача — ответить на вопрос, а не дать максимальную подборку релевантных ссылок. Поэтому ответом, скорее всего, будет выжимка из какой-нибудь (англоязычной) статьи в Википедии со ссылкой на источник.

Поисковик Powerset, использующий алгоритм семантического поиска и заточенный под Википедию (по-русски не ищет), реагирует на вопросы и при этом, исходя из запроса, предоставляет обширный инструментарий и навигационные приспособления для извлечения информации из Википедии.

Любопытный эксперимент представляет собой созданный, видимо, забавы ради англоязычный поисковик Omnipelagos.com. Эта система устанавливает связи между двумя понятиями (например, между вороном и письменным столом — правда, довольно условно).

Совсем недавно, в 2010 г., запустили поисковик Yebol. Наряду с поисковиками Hakia и Powerset, эта система использует алгоритм семантического поиска, который подразумевает интерпретацию запроса и призван решать гораздо более сложные задачи, чем те, с которыми работает, скажем, Google (система, в основе которой лежит поиск по ключевым словам и ранжирование страниц). У Yebol удобный интерфейс — он сразу распределяет результаты по различным категориям (с учетом «Твиттера», новостных лент, форумных обсуждений и пр.), — и в ответ на простые запросы он выдает вполне полезные ресурсы. С другой стороны, пока нельзя сказать, чтобы результаты его поиска значительно отличались от результатов Google, хотя иногда ему быстро добираться до не самых очевидных, но полезных ресурсов. Впрочем, вероятно, пользователям, со своей стороны, нужно учиться по-новому формулировать задачи по мере развития поисковых возможностей.

[1] Один сотрудник Microsoft – по его утверждению совершенно бескорыстно, для развлечения, - сделал сайт BlindSearch, который обрабатывает запрос в трех поисковиках (Bing, Google и Yahoo) одновременно. Результаты выдаются в трех колонках, причем какая колонка какому поисковику принадлежит – не видно. Пользователь должен проголосовать за колонку с лучшими, на его взгляд, результатами, и только тогда выяснится, какой это был поисковик.

Обсудите в соцсетях

Система Orphus

Главные новости

16:49 В Иракском Курдистане убили трех дипломатов из Турции
16:23 СБУ заявила о задержании водителя перевозившего «Бук» водителя тягача
16:02 СМИ узнали об уголовном деле против задержавших Голунова полицейских
15:50 Песков рассказал про обсуждение предложения Володина об изменении Конституции
15:37 Amazon попал под антимонопольное расследование Еврокомиссии
15:07 Мосгоризбирком набрал 350 подписей «мертвых душ» у 12 кандидатов
14:58 Илон Маск представил чип для чтения мыслей
14:53 СПЧ призвал к осторожности с изменением Конституции
14:29 Аксенов пригрозил забирать транспорт за нелегальные перевозки
14:09 Банки в РФ заработали 1 триллион рублей за полгода
13:55 Сотрудник ФСБ признался в разбое
13:39 Генпрокурор потребовал проверить подготовку иркутских властей к наводнению
13:20 Избиркомы отказали в регистрации 57 кандидатам в Мосгордуму
13:02 Защита Голунова заявила о незнании про дела против сотрудников полиции
12:50 Тайка Вайтити снимет нового «Тора»
12:46 Виноградарство стало самым рентабельным сектором АПК
12:46 Против Порошенко завели 11 уголовных дел
12:39 Продлен арест задержанных в Керченском проливе моряков
12:34 Apple представила новые эмодзи
12:30 Из найденных в Гибралтаре костей неандертальцев смогли извлечь ДНК
12:17 Внештатный нарколог Минздрава предложил продавать спиртное на пустырях
12:15 В Петербурге экстренно прооперировали звезду сериала «Улицы разбитых фонарей»
12:10 «Новая газета» опубликовала новое видео пыток в ярославской колонии
12:00 Эксперты разъяснили правила для бизнеса в жилых домах
11:47 Роспотребнадзор назвал основную причину развития онкологии
11:39 В греческом аэропорту произошла потасовка с участием россиян
11:36 На британку составлен протокол за лекцию в Красноярске
11:30 Мыши заменят кошек в исследованиях токсоплазмоза
11:21 Против астраханских чиновников и бизнесменов возбудили 17 дел
11:17 Двум россиянам предъявлены обвинения в ЧП на салюте в Минске
11:05 Источник назвал причину переноса запуска ракеты «Протон-М»
10:58 Аналитик назвал самый неблагоприятный день для российской валюты
10:58 Родственники погибших с рейса MH17 выступили с обвинениями в адрес РФ
10:44 Китайские туристы угрожают уничтожением уникальному пляжу во Владивостоке
10:31 Саакашвили рассказал о хорошей жизни украинцев при Советском Союзе
10:30 Связанный с болезнью Альцгеймера белок быстрее распространяется в мозге женщин
10:11 В крымском Минздраве подтвердили массовое отравление в детском лагере
10:09 В Эмиратах проводят конкурс в честь первого космонавта
10:04 Палата представителей осудила Трампа за расизм
09:59 Один российский город попал в мировой рейтинг безопасности
09:45 В России резко вырос спрос на продукты с «обозначениями натуральности»
09:42 В Жуковском готовится сесть борт МЧС с неисправностью
09:28 Суд в Москве заочно арестовал двух фигурантов дела экс-сотрудника ФСБ Черкалина
09:20 Впервые замечено формирование спутника у экзопланеты
09:15 Володин предложил поправки о балансе ветвей власти в Конституцию
09:01 В «Фобосе» предупредили о возможном вечернем подтоплении в Москве
08:52 Шойгу заявил об одобрении Путиным повышения оклада рядовых контрактников
08:48 Приморский суд дал подпольным банкирам условный срок за хищение 17 млн рублей
08:41 Траты Мосгоризбиркома на повышение правовой культуры избиркомов оценили в 16 млн рублей
08:35 Больше половины опрошенных россиян хорошо относятся к Украине
«АвтоВАЗ» «ВКонтакте» «Газпром» «Зенит» «Мемориал» «Мистраль» «Оборонсервис» «Роснефть» «Спартак» «Яблоко» Абхазия Австралия Австрия Азербайджан Антимайдан Аргентина Арктика Армения Афганистан Аэрофлот Башкирия Белоруссия Бельгия Бразилия ВВП ВКС ВМФ ВПК ВТБ ВЦИОМ Ватикан Великобритания Венесуэла Владивосток Внуково Волгоград ГИБДД ГЛОНАСС Генпрокуратура Германия Голливуд Госдеп Госдума Греция Гринпис Грузия ДТП Дагестан Домодедово Донецк ЕГЭ ЕСПЧ Евровидение Еврокомиссия Евромайдан Евросоюз Египет Екатеринбург ЖКХ Израиль Ингушетия Индия Индонезия Интерпол Ирак Иран Испания Италия Йемен КНДР КПРФ Казань Казахстан Калининград Камчатка Канада Каталония Кемерово Киев Киргизия Китай Коми Конституция Кремль Крым Куба Курилы ЛГБТ ЛДПР Латвия Ливия Литва Лондон Луганск МВД МВФ МГУ МКС МОК МЧС Малайзия Мексика Мемория Минздрав Минкомсвязи Минкульт Минобороны Минобрнауки Минпромторг Минсельхоз Минтранспорта Минтруд Минфин Минэкономразвития Минэнерго Минюст Молдавия Мосгорсуд Москва НАСА Нигерия Нидерланды Новосибирск Норвегия ОБСЕ ООН ОПЕК Одесса ПДД Пакистан Паралимпиада Париж Пентагон Польша Право Приморье Продовольствие РАН РЖД РПЦ РФС Росавиация Роскомнадзор Роскосмос Роспотребнадзор Россельхознадзор Россия Росстат СМИ СССР США Сахалин Сбербанк Севастополь Сербия Сирия Сколково Славянск Сочи Таджикистан Таиланд Татарстан Трансаэро Турция УЕФА Узбекистан Украина ФАС ФБР ФИФА ФСБ ФСИН ФСКН Филиппины Финляндия Франция Харьков ЦИК ЦРУ ЦСКА Центробанк Чехия Чечня Швейцария Швеция Шереметьево Эбола Эстония ЮКОС Якутия Яндекс Япония авиакатастрофа автопром алкоголь амнистия армия археология астрономия аукционы банкротство беженцы бензин беспилотник беспорядки биатлон бизнес бокс болельщики вандализм взрыв взятка вирусы вузы выборы гаджеты генетика гомосексуализм госбюджет госзакупки госизмена деньги дети доллар допинг драка евро журналисты законотворчество землетрясение импорт инвестиции инновации интернет инфляция ипотека искусство ислам исследования история казнь кино кораблекрушение коррупция космос кража кредиты культура лингвистика литература медиа медицина метро мигранты монархия мошенничество музыка наводнение налоги нанотехнологии наркотики наука недвижимость некролог нефть образование обрушение общество ограбление оппозиция опросы оружие офшор палеонтология педофилия пенсия пиратство планетология погранвойска пожар полиция похищение правительство православие преступность происшествия ракета рейтинги реклама религия ретейл рубль санкции связь сепаратизм следствие смартфоны социология спецслужбы спутники страхование стрельба строительство суды суицид тарифы театр телевидение теракт терроризм технологии транспорт туризм убийство фармакология физика фоторепортаж футбол хакеры химия хоккей хулиганство цензура школа шпионаж экология экономика экспорт экстремизм этология «Единая Россия» «Исламское государство» «Нафтогаз Украины» «Правый сектор» «Северный поток» «Справедливая Россия» «болотное дело» Александр Лукашенко Александр Новак Александр Турчинов Алексей Кудрин Алексей Навальный Алексей Улюкаев Амурская область Анатолий Сердюков Ангела Меркель Антон Силуанов Аркадий Дворкович Арсений Яценюк Барак Обама Басманный суд Башар Асад Белый дом Борис Немцов Валентина Матвиенко Верховная Рада Верховный суд Виктор Янукович Виталий Мутко Владимир Жириновский Владимир Зеленский Владимир Маркин Владимир Мединский Владимир Путин Вячеслав Володин Дальний Восток День Победы Дмитрий Медведев Дмитрий Песков Дмитрий Рогозин Дональд Трамп Евгения Васильева Забайкальский край Интервью ученых Ирина Яровая Иркутская область История человечества Кирилл Серебренников Конституционный суд Космодром Байконур Краснодарский край Красноярский край Ксения Собчак Ленинградская область МИД России Мария Захарова Михаил Прохоров Михаил Саакашвили Михаил Ходорковский Московская область Мурманская область Надежда Савченко Николас Мадуро Нобелевская премия Новосибирская область Новый год Олимпийские игры Ольга Голодец Павел Дуров Палестинская автономия Папа Римский Первый канал Пермский край Петр Порошенко Почта России Приморский край Рамзан Кадыров Реджеп Эрдоган Республика Карелия Ростовская область Саратовская область Саудовская Аравия Свердловская область Сергей Лавров Сергей Нарышкин Сергей Полонский Сергей Собянин Сергей Шойгу Следственный комитет Совбез ООН Совет Федерации Ставропольский край Счетная палата Тереза Мэй Франсуа Олланд Хабаровский край Хиллари Клинтон Челябинская область Черное море Эдвард Сноуден Элла Памфилова Эльвира Набиуллина Южная Корея Юлия Тимошенко Юрий Чайка авторское право администрация президента акции протеста атомная энергия баллистические ракеты банковский сектор биология большой теннис визовый режим военная авиация выборы губернаторов газовая промышленность гражданская авиация гуманитарная помощь декларации чиновников дороги России информационные технологии климат Земли компьютерная безопасность космодром Восточный крушение вертолета легкая атлетика лесные пожары междисциплинарные исследования мобильные приложения морской транспорт некоммерческие организации общественный транспорт патриарх Кирилл пенсионная реформа пищевая промышленность права человека правозащитное движение преступления полицейских публичные лекции российское гражданство русские националисты русский язык сельское хозяйство сотовая связь социальные сети стихийные бедствия телефонный терроризм уголовный кодекс фигурное катание финансовый рынок фондовая биржа химическое оружие эволюция экономический кризис ядерное оружие Великая Отечественная война Вторая мировая война Ирак после войны Ким Чен Ын Революция в Киргизии Российская академия наук Стихотворения на случай Федеральная миграционная служба Федеральная таможенная служба борьба с курением выборы мэра Москвы здравоохранение в России связь и телекоммуникации тюрьмы и колонии Совет по правам человека аварии на железной дороге естественные и точные науки закон об «иностранных агентах» видеозаписи публичных лекций «Полит.ру» Новые технологии, инновации Сочи 2014 Кабардино-Балкария Левада-Центр Нью-Йорк Санкт-Петербург отставки-назначения шоу-бизнес Ростов-на-Дону ЧМ-2018 Компьютеры, программное обеспечение Книга. Знание ВИЧ/СПИД Apple Bitcoin Boeing Facebook G20 Google iPhone IT NATO PRO SCIENCE видео ProScience Театр Pussy Riot Telegram Twitter Wikileaks

Редакция

Электронная почта: polit@polit.ru
Телефон: +7 929 588 33 89
Яндекс.Метрика
Свидетельство о регистрации средства массовой информации
Эл. № 77-8425 от 1 декабря 2003 года. Выдано министерством
Российской Федерации по делам печати, телерадиовещания и
средств массовой информации. Выходит с 21 февраля 1998 года.
При любом использовании материалов веб-сайта ссылка на Полит.ру обязательна.
При перепечатке в Интернете обязательна гиперссылка polit.ru.
Все права защищены и охраняются законом.
© Полит.ру, 1998–2019.