раз потому, что это действие выглядит очень простым и давно совершается на автомате, чрезвычайно важно совершать его правильно.
Нет ничего проще, чем найти веб-страницы, содержащие фамилию известного человека или название определенного продукта. Однако в реальных поисковых задачах ключевые слова попросту неизвестны; например, нам нужно понять действия людей, принимающих решение о покупке металлорежущих станков, – что вбивать в строку поиска?!
В таких случаях одного и даже десяти запросов недостаточно, и поиск необходимо вести по определенному алгоритму. В DaShe этот алгоритм называется «Погружение в тему» и представляет собой процесс конкретизации описания предметной области от самого общего (несколько слов) до пригодного к использованию в проекте (детальное описание плюс коллекция веб-страниц). Пригодность результата оценивается по критерию “Five Ws + Two How” – то есть по наличию ответов на семь контрольных вопросов. Благодаря этому результатом погружения в тему оказывается не найденная где-то в Сети случайная веб-страница с информацией, а сформированное в ходе поиска понимание предметной области, которое, как правило, решает исходную проблему.
Нужно заметить, что, в отличие от простого поиска, когда нужная страница находится в течение нескольких минут или нескольких часов, решение сложной поисковой задачи потребует от нескольких дней до нескольких недель.
Поэтому особенно важно не бросать дело на полдороге и помнить, что хорошее понимание одной области может принести идею, вытаскивающую весь проект, – а вот плохое понимание сотни других областей не даст ничего, кроме воспроизводства чужих ошибок.
Погружение в тему обеспечивается итерационным уточнением набора ключевых слов до тех пор, пока результаты не дадут ответы на все контрольные вопросы.
1. Формируется первичный (заведомо недостаточный) список ключевых слов («металлорежущие станки» и найденные по словарю синонимы).
2. На полученных в выдаче веб-страницах ищутся:
1) источники информации по теме (сайты, книги, журналы, форумы, новостные агрегаторы и т. д.);
2) новые ключевые слова, более подходящие для целей поиска.
3. Источники информации внимательно прочитываются, ключевая информация помещается в отдельный файл со ссылками на источник. Появившиеся по ходу чтения идеи записываются туда же.
4. Проверяется достаточность понимания темы. Критерий – способность ответить на все семь контрольных вопросов: кто, что, где, когда, как, почему и сколько (Five Ws + Two How). В нашем примере с металлорежущими станками нужно получить перечень типов субъектов, принимающих решение о закупках (кто), количество и типы заключаемых ими сделок (что), места их профессионального и личного общения – форумы, аккаунты в соцсетях (где), бюджетные циклы и сезонность сделок (когда), порядок подготовки и принятия решений (как), мотивы субъектов, принимающих решение о закупках (почему), и, наконец, примерные объемы закупок (сколько).
По контрольным вопросам становится понятно отличие в объеме