Оптимизация альтернативных форматов документов (Flash, PDF, DOC и XML)
    Автор: admin  
Поисковые системы индексируют не только традиционные для Интернета HTML-документы. Их индексы пополняются информацией, полученной из документов, созданных в форматах, более привычных в "офлайновой" среде — PDF, DOC и XML. Расскажем чуть подробнее об этих форматах. PDF (Portable Document Format). Этот формат записи документов был предложен в 1993 году компанией Adobe. Эта же компания предоставляет программу для просмотра и печати документов этого формата — Adobe Acrobat. Одно из основных преимуществ данного формата — универсальность. PDF позволяет сохранять первоначальный вид документа со всеми шрифтами, графическими элементами и т.п. PDF-файлы можно открывать с помощью программы Adobe Acrobat Reader, существующей для любой платформы. Что не менее важно, разного рода графические схемы можно увеличивать или уменьшать без серьезных потерь в качестве — это достигается за счет использования элементов векторной графики. Последнее свойство PDF-формата объясняет его высокую популярность для сохранения технической документации, руководств пользователя и т.п., ведь не секрет, что PDF стал буквально стандартом для описания технических характеристик устройств (особенно электронных) у большинства разработчиков. Поэтому в Интернете нельзя не считаться с этим форматом. DOC и XLS. Форматы популярнейшего текстового редактора MS Word и редактора таблиц MS Excel, входящих в стандартный пакет офисных программ Microsoft Office. В Интернете содержится много информации в этих форматах — рефераты, доклады, отчеты, таблицы и др. Поэтому желание поисковых систем извлекать информацию из этих документов и показывать пользователям вполне понятно. Flash. Этот формат разработан компанией Macromedia (впоследствии приобретенной компанией Adobe) для мультимедийных объектов — анимационных роликов, звукового сопровождения и т.п. Средства воспроизведения распространяются как подключаемый к браузеру модуль (plug-in). В настоящее время этот формат получил широкое распространение, поскольку позволяет в относительно небольшом объеме данных описывать сложную анимацию и оперировать векторными объектами. Если на вашем сайте есть электронные книги, технические описания, документация, демонстрационные ролики и т.п., записанные в рассматриваемых форматах, можно приложить определенные усилия для повышения видимости этих документов в поисковых системах. Техника поисковой оптимизации PDF-, DOC- и XLS-файлов принципиально не отличается от работы с HTML-документами, необходимо лишь обратить внимание на одну особенность: в этих форматах текст, видимый пользователю, не всегда является текстом, доступным для поисковых машин. В принципе поисковые системы могут индексировать текст и ссылки в этих форматах. Но в PDF-файлах часто видимый пользователю текст на самом деле является изображением, а для XLS-файлов вообще характерно малое количество текста. Поэтому необходимо следующее: • сохранять данные в файле именно в текстовом виде; • обеспечить наличие в текстах файлов PDF-, DOC- и XLS-форматов ключевых слов № фраз, по которым вы бы хотели видеть ссылки на эти документы в результатах поиска (сделать это достаточно легко с помощью описанной ранее текстовой коррекции и/или внесения в текст необходимых развернутых текстовых комментариев — особенно это касается табличных файлов XLS); • сделать доступными данные файлы для поисковых роботов, т.е. проверить отсутствие защиты паролями и наличие легко индексируемых ссылок на эти файлы со страниц, известных поисковым системам; • заполнять поля метаданных документов, главным образом, поля title (заголовок документа), с внесением в них нужных ключевых слов и фраз. Пользователям содержимое титула практически не видно, но его содержимое учитывается поисковыми роботами. Отдельно стоит остановиться на продвижении сайтов, где информация представлена в SWF-формате (Flash-ролики). Некоторые поисковые системы, например Яндекс, умеют индексировать Flash-документы — для этого поисковик сохраняет текстовое представление Flash-документа. Но во Flash-ролике невозможно разместить много текстовой информации, поэтому если вы хотите использовать этот очень привлекательный для пользователей формат на сайте, нужно размещать Flash-ролики на обычных текстовых HTML-страницах. При этом необходимо, по возможности, дублировать текстовую информацию из Flash внизу страницы, а также правильно заполнять титульные фразы страниц. В итоге поисковые системы будут правильно индексировать текстовое содержимое из HTML и FLASH и эффективно отображать такую страницу в результатах поиска, а пользователи увидят на первом экране (изображение страницы на мониторе без использования прокрутки экрана) яркий Flash-ролик. 15.3. Выводы Список необычных способов продвижения, описанных в данной главе, вряд ли можно назвать полным. Любой необычный и новый прием, приводящий к увеличению целевой посещаемости сайта, сначала изобретается и используется немногими. По мере увеличения количества осведомленных лиц растет и популярность метода, что позволяет отнести его к уже "обычным", "стандартным" технологиям. Технологии продвижения не только рождаются, но и устаревают. Скорее всего, в будущем поисковые системы будут столь же уверенно работать с DOC-, Flash- и XML-форматами, а количество таких документов в Интернете увеличится настолько, что составит конкуренцию традиционному формату HTML. Возможно также, что поисковые системы станут автоматически подставлять правильный вариант запроса в случаях, если слово написано с ошибкой или опечаткой. Конечно, при этом будет утрачен смысл продвижения по ошибочным запросам, а проблемы оптимизации новых форматов будут активно обсуждаться вебмастерами и специалистами по поисковому продвижению. Таким образом, подготовка таких документов к правильному индексированию и ранжированию станет общепринятой, стандартной процедурой. Тогда оптимизаторам, желающим уйти со стандартного пути продвижения в конкурентной среде, придется придумать какие-то новые, необычные методы. Не следует, однако, путать необычные и нестандартные методы с "черными", запрещенными методами продвижения. Существовали, существуют и будут появляться способы воздействия на поисковые системы, которые, несмотря на эффективность, в конечном счете приводят к негативным последствиям — уничтожению релевантности поисковой выдачи, ухудшению сайтов и нарушениям работы поисковых систем. Их применение называется спамом поисковых индексов, или спамдексин-гом. Нужно знать об этих методах, чтобы понимать, какие именно услуги предлагает вам оптимизатор и какие риски вы на себя берете. Следующая глава нашей книгиV— о спамдексинге, или о запрещенных технологиях.


 

 
 
Какой поисковик лучше?


   
 

 
Популярные новости