Экспериментальная версия Gmail: теперь по всему миру

31.03.2009

Пал Такачи (Pal Takacsi, Менеджер инженерных проектов

Пять лет назад из экспериментального проекта, созданного небольшой командой разработчиков Google, родился почтовый сервис Gmail. С самого начала мы стремились к тому, чтобы наша почта была быстрой, удобной и максимально защищенной от спама. Мы развивали ее, запуская такие сервисы, как видеочат и темы. Сегодня, в канун пятилетия Gmail, десятки миллионов людей во всем мире используют Gmail, причем большинство из них живут за пределами Соединенных Штатов.

В прошлом году мы создали экспериментальную версию Gmail (Gmail Labs), общедоступный полигон новых возможностей, позволяющий нашим пользователям самим решать, какие функции достойны стать частью их почты. Сегодня мы рады объявить о том, экспериментальная версия Gmail стала доступна на 49 языках пользователям по всему миру.

Вам может показаться странным, почему, если большинство функций Gmail было сразу запущено на всех поддерживаемых языках, Gmail Labs до сих пор не были доступны на русском? Дело в том, что проект изначально был экспериментом, которым наши сотрудники занимались как 20-процентным проектом (20% своего рабочего времени наши сотрудники могут уделять разработке интересующих их проектов), поэтому существовало множество рисков. Дело в том, что каждый раз, когда пользователь входит в Gmail, мы создаем индивидуальный Java-скрипт персонально для него. Поскольку в экспериментальной версии сейчас 43 возможности, существует 2 в 43 степени (~8 триллионов) возможных версий Java-скрипта. Если учесть 49 языков, на которых сегодня работает Gmail Labs, получится еще больше - 49 x 2 в 43 степени (~430 триллионов версий). Очевидно, что протестировать все эти версии - непростая задача. Мы приложили очень много усилий, чтобы создать модульную архитектуру для поддержки такого набора функций, и пока она работает очень даже неплохо. Поэтому мы подумали, а почему бы не заняться еще 422 триллионами комбинаций?

С момента создания экспериментальной версии Gmail в июне прошлого года, мы запустили 43 функции в течение 43 недель. Сюда вошли полезные возможности (например, Gmail Офлайн и Напоминалка о неприложенных файлах), хитроумные функции (например, Импорт/Экспорт фильтра) и даже забавные фичи (например, Защита от необдуманных писем). Все эти возможности доступны на закладке Labs в разделе Настройки. Имейте в виду, что все эти функции находятся в самом начале разработок, поэтому они не проходят этапы проектной экспертизы и продуктового анализа, а также не тестируются так глубоко, как базовые функции. Поэтому иногда экспериментальная версия может давать сбои. В случае обнаружения проблем после входа в аккаунт Gmail вы можете в любой момент временно отключить Gmail Labs, воспользовавшись этой ссылкой.

Технологии ранжирования Google

Амит Сингал (Amit Singhal), руководитель команды ранжирования Google

В своем предыдущем посте я рассказал вам о принципах ранжирования Google. В рамках нашего обсуждения качества поиска я бы хотел рассказать вам о технологиях, используемых при ранжировании результатов поиска Google. Наши базовые технологии используют достижения академической дисциплины, которая называется «Информационный поиск» (по-английски «Information Retrieval» или сокращенно IR). Ученые занимаются поиском уже почти 50 лет. При этом при ранжировании веб-страниц используются статистические сигналы значимости слов, такие как частота употребления. (См. статью "Современный информационный поиск. Краткий обзор"). Информационный поиск дал нам прочный фундамент, на котором мы построили передовую систему, использующую анализ гиперссылок, структуры страниц, а также много других инновационных разработок.

В последнее десятилетие возможности поиска существенно расширились. Если раньше поиск отвечал на вопрос "найдите мне то, что я сказал", то теперь он отвечает на вопрос "найдите мне то, что я хочу". Ожидания пользователей в отношении поиска также сильно выросли. Мы усердно работаем над тем, чтобы оправдать ожидания всех и каждого. Для этого мы должны лучше понимать страницы, запросы и самих пользователей. В течение последних 10 лет мы смогли достичь принципиально новых высот в развитии технологий, позволяющих понять все эти три составляющие поискового процесса.

Когда мы в Google обсуждаем запросы, мы обычно заключаем текст запроса в квадратные скобки [ ] (см. статью Мата Катса "Как писать запросы"). В этом посте я буду обозначать запросы именно так. Страницы и результаты поиска меняются постоянно, поэтому с течением времени некоторые примеры могут отображаться иначе.

Понимаем страницы. В течение многих лет мы вкладывали усилия в развитие нашего поискового робота и системы индексирования. В итоге сейчас мы имеем очень большой и актуальный индекс веб-страниц. Помимо увеличения размеров индекса и повышения его актуальности, мы добились еще некоторых улучшений. Одна из наших наиболее важных технологий для понимания веб-страниц — это определение понятий, важных в контексте страницы, даже если связь со страницей неочевидна. Мы находим официальную домашнюю страницу Государственного Эрмитажа в Санкт-Петербурге на запрос на итальянском [Museo dell'Ermitage di San Pietroburgo], даже если на официальной странице не упоминается ни Санкт-Петербург, ни San Pietroburgo. Если американский пользователь ищет [cool tech pc vancouver, wa ], то ему выдается страница www.cooltechpc.com, несмотря на то, что на странице нигде не упоминается город Ванкувер (штат Вашингтон, США). Также мы разработали технологии, которые умеют отличать важные и неважные для конкретной страницы слова, а также учитывать, насколько свежая информация размещена на странице.

Понимаем поисковые запросы. Для нас важно не просто осуществлять поиск по конкретным словам, содержащимся в запросе, а четко понимать, что именно хотят найти пользователи, когда задают тот или иной запрос. Наша компания совершила ряд заметных технологических прорывов в данной области. Мы разработали лучшую в своем классе систему проверки орфографии запросов, передовую систему подбора синонимов, а также мощную систему анализа понятий, содержащихся в поисковом запросе.

Практически все пользователи сталкивались с нашей системой проверки орфографии. Эта система знает, что если пользователь ввел в поисковую строку [пояск в гуле], то скорее всего ему нужна информация о поиске в Google. В таком случае выводится сообщение: Возможно, вы имели в виду: поиск в гугле. Если же пользователь набрал [пояск кожаный], система понимает, что он ищет кожаный пояс. Осуществлять такой анализ одновременно на нескольких языках чрезвычайно сложно, но Google успешно с этим справляется.

Подбор синонимов является ключевым аспектом понимания запросов. Это одна из самых трудных задач, которыми мы занимаемся в Google. Несмотря на то, что подбор синонимов зачастую очевиден для человека, в области автоматической обработки текстов эта проблема еще не решена. Как пользователю мне не хотелось бы слишком задумываться над тем, какие именно слова использовать в своих запросах. Часто мне вообще неизвестно, какие слова лучше выбрать. В таких случаях в дело вступает наша система подбора синонимов, которая способна выполнять сложнейшие модификации запросов. Например, она знает, что в запросе [ДР Аллы Пугачевой] сочетание ДР означает день рождения, а в запросе [ДР Рим] – слово древний. Когда пользователь ищет [логический философский трактат Витгенштейна], он получает результаты, относящиеся к «Логико-философскому трактату» Людвига Витгенштейна, а по запросу [реляционные БД] система автоматически находит информацию о реляционных базах данных. Мы добились такого уровня понимания запросов почти для ста различных языков, что является для меня предметом особой гордости.

Еще одна технология, которую мы используем в нашей системе ранжирования результатов, это определение понятий, интересующих пользователя. Она позволяет значительно повысить релевантность поиска. Например, наши алгоритмы понимают, что по запросу [Казанова певица] пользователю необходима информация о певице Сати Казановой, а не об известном ловеласе XVIII века Джакомо Казанове. Но мы не останавливаемся на идентификации, мы обогащаем результаты поиска адекватными концепциями. Например, если пользователь ищет информацию о [влиянии компьютера на человека], то ему хочется узнать не столько о том, как компьютер влияет на мировосприятие человека, сколько о его воздействии на здоровье и психику. Или если пользователь вводит [институт Баумана], то его интересует Московский Государственный Технический Университет имени Баумана. В наши алгоритмы анализа запросов встроено множество подобных разработок, и, как я уже говорил, мы умеем анализировать запросы практически на всех языках, которые поддерживает Google.

Понимание пользователей: Наша работа по пониманию пользователей заключается в том, что мы стараемся выдавать именно те результаты, которые реально нужны людям, а не просто слова, которые были введены в строку поиска. В первую очередь для этого применяется наша система локализации, передовая технология персонализации, а также ряд других выдающихся достижений, например, Универсальный поиск.

В нашей работе по локализации мы реализуем наш базовый принцип — наилучшее качество результатов поиска с учетом местной специфики в любой точке земного шара. Один и тот же запрос, набранный пользователями в различных странах, может давать абсолютно разные результаты. Например, если пользователь в США ищет [bank], он должен получить информацию об американских банках. А если то же самое слово ищет пользователь в Великобритании , то он, скорее всего, ищет либо производителя модной одежды и обуви "Bank Fashion", либо информацию о британских финансовых институтах. Аналогичный запрос должен выводить местные финансовые институты в таких странах, как Австралия, Канада, Новая Зеландия, Южная Африка. Забавные вещи начинаются, когда тот же самый запрос вводят в Египте, Израиле, России, Саудовской Аравии, Швейцарии или Японии. Аналогично запрос [football] относится к абсолютно разным видам спорта в Австралии, Великобритании и США. В этих примерах мы показали, как мы умеем правильно отображать локализованные версии одного и того же понятия (финансовые институты, виды спорта и т.д.). Однако один и тот же запрос может означать совсем разные вещи для пользователей в разных странах. Например, [Côte d'Or] – это географический регион во Франции. Но в соседней Бельгии – это крупный производитель шоколадных изделий. И мы умеем правильно понимать этот запрос.

Персонализация – это еще одна мощная возможность нашей системы поиска. Мы умеем адаптировать результаты поиска к потребностям конкретных пользователей. Пользователи, которые вошли в Google под своей учетной записью и подписались на сервис "История веб-поиска", имеют возможность получать результаты, которые лучше отвечают их запросам, чем общий поиск Google. Например, если человек, которого интересует железнодорожная тематика, вводит [локомотив], то он получит больше информации о локомотиве как транспортном средстве. Другие же пользователи получат, в первую очередь, информацию о футбольном клубе "Локомотив". Точно так же, если вы предпочитаете страницы конкретного интернет-магазина, то при поиске товаров вы получите больше результатов именно со страниц этого магазина. Как показывают наши опросы, пользователи считают, что персонализованный поиск дает более качественные результаты, чем неперсонализованный.

Еще один пример того, как мы предугадываем желания пользователя – это запрос [chevrolet magnum] На самом деле Magnum производит Dodge, а не Chevrolet, поэтому в выдаче мы также предлагаем результаты для [dodge magnum ].

Наш Универсальный поиск – еще один пример того, как мы умеем правильно понимать пользователей и выдавать именно те результаты, которые им действительно нужны. Например, на запрос [стокгольм] пользователь получает не только важные веб-страницы о шведской столице, но и карту города, и картинки с его видами. Сейчас мы также показываем свежие новости о Стокгольме .

Я мог бы продолжать бесконечно долго, приводя примеры наших технологий, обуславливающих передовой уровень системы ранжирования Google. Однако мы прекрасно осознаем, что поиск информации не является окончательно решенной проблемой. На многие запросы мы пока не умеем выдавать удовлетворительные результаты, и каждый из таких запросов – это возможность улучшить нашу систему ранжирования. Я уверен, что те многочисленные технологии, которые сейчас разрабатывает наша команда, позволят нам в самом ближайшем будущем достичь существенного повышения качества нашего поиска.

Я надеюсь, что два моих поста о ранжировании Google позволили вам убедиться в том, что мы в Google живем и дышим поиском, и наша страстная увлеченность им сегодня сильна как никогда. Мы гордимся тем, что у нас очень хорошая система ранжирования, и мы невероятно много работаем изо дня в день, чтобы она становилась еще лучше.

Два улучшения для страницы результатов поиска Google

27.03.2009



Сегодня мы запускаем два улучшения для поиска Google. Первое из них предлагает расширенный список дополнительных поисковых запросов. Второе представлет собой расширенные описания результатов поиска. Оба улучшения помогают более эффективно перенаправить пользователей к информации, которая им требуется.

Больше дополнительных вариантов поисковых запросов

Мы рады представить вам новую технологию, которая сможет лучше понять концепцию вашего запроса. Благодаря ей теперь мы можем предложить вам еще более обширный список дополнительных поисковых запросов, которые появляются под или над результатами поиска.

Например, если вы ищете в Google [гадание на картах], то мы знаем, что такие слова как "таро", "ленорман", "тибетское гадание мо" являются понятиями, относящимися к вашему запросу, и с большой долей вероятности могут помочь вам найти необходимую информацию. Например:



Теперь предлагаемые варианты формулировок будут более точными и распостранятся на большее количество запросов, языков, включая более длинные запросы. Начиная с сегодняшнего дня, вы сможете увидеть больше вариантов формулировок поисковых запросов на 37 языках по всему миру.

Длинные снипеты

Когда вы ищете что-то на Google, каждый результат, который мы предлагаем вам, содержит темно-синий заголовок и несколько строк текста (то, что мы называем "снипет"). Вместе они дают вам представление о содержании страницы. Чтобы пояснить, в каком контексте упоминается ваш запрос, снипет выделяет его жирным шрифтом.

Когда вы вводите запрос, состоящий из более чем трех слов, объема стандартных снипетов может быть недостаточно для понимания контекста. Поэтому мы увеличили объем текста в снипете, чтобы показать в контексте страницы больше информации и слов, которые вы ввели.

Предположим, что вы ищете информацию о вращении Земли и, в частности, хотели бы узнать ее наклон и расстояние до Солнца. Вы вводите в поисковой строке Google [наклон оси вращения земли и расстояние до солнца]. Стандартные снипеты слишком коротки, чтобы показать контекст всех слов этого запроса на найденных страницах. Теперь, в подобных случаях, мы автоматически удлинняем снипеты для результатов.



Это лишь два примера наших недавних улучшений в поиске - мы постоянно работаем над улучшением качества поиска на русском и других языках.

Google Summer of Code - 2009

26.03.2009



Подготовка к Google Summer of Code-2009 в самом разгаре. Цель данной программы – познакомить студентов с современными методами разработки открытого программного обеспечения. За последние четыре года программа стала очень популярна. В проекте приняло участие около 2500 выпускников высших учебных заведений, которые работали и учились под руководством более 2500 наставников, представителей крупных IT-компаний и высших учебных заведений. Более 15 млн. долларов, выделенных на проекты open source, принесли миллионы строчек исходного кода. В этом году на выбор студентам предлагается более 150 проектов в области открытого программного обеспечения и технологий, охватывающих широкую проблематику — от операционных систем до систем управления контентом.

В рамках программы-2008 более 975 студентов успешно выполнили свои проекты. Каждый участник получил стипендию в размере 4500 долларов и крутую футболку под стать своим новоприобретенным навыкам программирования. Особенно важны для нас социальные контакты, которые завязались между участниками программы. Программа уже объединила участников из более чем 98 стран. Мы надеемся, что в этом году программа Google Summer of Code будет еще более представительной.

Мы принимаем заявки на участие в программе до 3 апреля 2009 г. Чтобы получить дополнительную информацию об участии в конкурсе, ознакомьтесь с ответами на часто задаваемые вопросы или подпишитесь на рассылку форума. Мы также ждем вас на нашем блоге, посвященном вопросам открытого кода, где вы сможете найти самую актуальную информацию о программе. Когда будете готовы, оставьте заявку на сайте Google Summer of Code 2009. Желаем удачи!

Также вы можете ознакомиться с видеороликом о программе:

iGoogle в русском стиле

25.03.2009

Александр Варес, маркетинг Google Россия

Сервис iGoogle уже полюбился многим из нас. Тут каждый может дать свободу творческому потенциалу, создавая свой дизайн стартовой странички Google. И мы задались вопросом - как расширить возможности дизайна iGoogle для нас, российских пользователей? Недавно мы запустили совершенно новый каталог тем, которые близки нам с вами. "Любимые темы" - это дизайны исключительно российской тематики, доступные для пользователей из любого уголка мира.  


Мы не зря назвали темы любимыми, ведь что-то близкое сердцу сможет отыскать в них практически каждый. Поклонникам спорта придутся по душе темы Марии ШараповойАндрея Аршавина, футбольных клубов ЦСКА и Зенит.

Любители музыки найдут здесь t.A.T.u.Диму БиланаМакSимВалерию, группы "Кипелов"Uma2rmaH и "Мумий Тролль".
.

Любители книг смогут установить темы "Мастер и Маргарита""Миры Братьев Стругацких" и "Макс Фрай".
.

Ну и то, что уж точно не оставит никого равнодушным - это темы на основе мультиков о  Ёжике в туманеВинни-Пухе, Чебурашке и Крокодиле ГенеМалыше и Карлсоне, а также "ходячего сарказма в синей юбке и красном топике" - Масяни тм.
п 

Хотелось бы отметить, что этот проект был создан в тесном сотрудничестве с партнёрами, и мы им очень благодарны за то, что именно они сделали это возможным.

Новые слои на Картах Google

20.03.2009



После месяцев упорной работы мы рады объявить о запуске слоя с маршрутами общественного транспорта Москвы и Санкт-Петербурга! Этот слой добавился к уже запущенным фотографиям, видеороликам и википедийным достопримечательностям, спрятанными под кнопкой “Ещё...”. Кроме того, теперь при нажатии на остановки общественного транспорта будут подсвечиваться проходящие через остановку маршруты.



Другой запущенный на этой неделе слой позволяет увидеть на карте расположение всего множества объектов, отвечающих запросу пользователя. Например, можно увидеть, где находятся театры в Санкт-Петербурге - они будут помечены красными точками.

Мы знаем, что пока на Картах нет электричек и маршруток и что в России ещё много городов с обширной сетью общественного транспорта. Все это возможности для дальнейших улучшений, и мы будем работать над этим и многим другим – следите за обновлениями!

Google Новости на вашем сайте – это просто

19.03.2009



В начале февраля мы выпустили дополнение к AJAX API для Поиска, которое позволяет самостоятельно добавить на сайт анимированный блок службы "Google Новости". В блоке будут по очереди демонстрироваться заголовки, отрывки и фотографии из новостей по темам, которые вы выбрали. Вот как это будет выглядеть на странице:



Добавить блок очень легко. Просто включите следующий сегмент в свой HTML-код:


<iframe src="http://www.google.com/uds/modules/elements/
newsshow/iframe.html?format=300x250&hl=ru"
frameborder="0" width="300" height="250"
marginwidth="0" marginheight="0">
</iframe>


Блок новостей доступен в двух размерах: 728x90 и 300x250.

Размер и содержание блока можно изменять, используя простой мастер настройки. Вы также можете работать с кодом самостоятельно, что даёт ещё больше возможностей. Ознакомьтесь с документацией по настройке блоков новостей и возможностями по их тестированию на площадке для экспериментов с API.

Как всегда идеи и пожелания можно оставлять на нашем форуме
пользователей Google AJAX API.



Эксперименты с Chrome



Когда мы выпустили Google Chrome в сентябре прошлого года, мы представили V8 - технологию нового движка обработки JavaScript, - предназначенную для улучшения работы веб-приложений следующего поколения в браузере. За последние несколько месяцев мы связались с добрым десятком разработчиков и дизайнеров ПО, чтобы поэкспериментировать с V8 и найти новые интересные способы использования JavaScript. Среди тех, кто нам помогал, были REAS, Mr. Doob, Ryan Alexander, Josh Nimoy, Mark Mahoney, и Toxi.

Результаты их экспериментов потрясают воображение - каждый проект превращает окно браузера в интерактивное приложение, игру, и даже в художественную инсталляцию. То, чего они достигли, сможет оценить как продвинутый разработчик JavaScript, так и обычный пользователь Интернета.

Вот пример некоторых приложений, которые были созданы в ходе эксперимента:



Загляните и вы на сайт Экспериментов с Chrome. Для просмотра сайта Google Chrome необязателен, но в более старых браузерах некоторые эксперименты могут тормозить, или отображаться с ошибками. Чтобы скачать Google Chrome, нажмите сюда.

Конечно же, нам хочется больше новых экспериментов. Мы будем регулярно обновлять сайт и продвигать лучшие проекты на главной странице в разделе "Featured Experiments". Так что, если у вас есть идея хорошего эксперимента с веб-браузером, смело реализуйте её, представьте во всей красе и присылайте нам.

Мы расскажем о наиболее ярких экспериментах и проведём несколько выступлений на тему Google Chrome на конференции Google I/O 27-28 мая в Сан-Франциско.