DataLife Engine 9.2 > Важно знать > Как «пробить» человека в Интернет: используем операторы Google и логику

Как «пробить» человека в Интернет: используем операторы Google и логику


15 октября 2017. Разместил: inna

Как «пробить» человека в Интернет: используем операторы Google и логику

Мы постоянно встречаемся в своей жизни с новыми людьми, и стоит констатировать, что помимо хороших друзей нам попадаются мутные товарищи, а иногда и отъявленные мошенники. Любовь наших сограждан оставить свой след в интернете и старания наших ИТ-компаний по автоматизации всего и вся позволяют нам довольно оперативно собирать интересующую информацию о конкретных персонах по открытым источникам. Чтобы это делать быстро и качественно, нам нужно владеть простой методологией разведывательной работы и знать, где и какую информацию о человеке можно добыть в интернете.

Как работает разведка?

Доступной моделью работы любой разведывательной службы является так называемый разведывательный цикл. Ниже представлена иллюстрация цикла, взятая с сайта ФБР.
 


Мы можем творчески перевести и сгруппировать немного по-своему и получить следующие этапы:
 

  1. Постановка задачи/формулировка проблемы;
  2. Планирование;
  3. Сбор данных;
  4. Обработка данных;
  5. Анализ информации;
  6. Подготовка отчета и презентация результатов.

Возьмем эту модель на вооружение и адаптируем для наших благих целей проверки нечистоплотных товарищей.

Шаг 1. Постановка задачи

Обычно задача про проверке какого-либо человека ставится примерно так: “Надо собрать всю информацию об этом человеке!” По факту чаще всего нам интересно знать его биографию, психологический портрет, круг знакомств.

Шаг 2. Планирование

Не имея плана поиска и анализа данных, мы будем долго и грустно смотреть в экран и отправлять в поисковики различные запросы, содержащие крупицы известных нам данных о нашей цели. Если нам повезет, то мы сможем что-нибудь выловить, если нет – то зря потратим время в попытках перетрясти весь интернет.

Как спланировать наши действия?

1) Нам нужно собрать все, что известно на текущий момент: имя, фото, тел, сфера деятельности, друзья и т.д. и т.п. Как правило, самой ценной информацией является ник, используемый человеком в интернете (чаще всего его можно получить, зная личный адрес электронной почты).

2) Нам нужно сформулировать рабочие гипотезы для поиска данных на основе имеющейся информации. Например:
 

  • Человек работает в компании, занимающей продажей комбикормов, название которой заканчивается на «ва»: мы видели фотографию с выставки и смогли рассмотреть часть названия компании.
  • Возраст от 30 до 40: оценили по голосу или описанию.
  • Дружит с таким-то человеком.
  • и т.п.

Примечание. Талантливый разведчик должен уметь переключаться между двумя состояниями: безудержный креатив и жуткое занудство. В первом случае накидываем гипотезы для проверки, а во втором тщательно их проверяем: находим информацию и отбраковываем гипотезы в случае выявления несоответствий.

3) Имея рабочие гипотезы, продумываем какие источники данных нам могут быть полезны в этом легком деле по выводу на чистую воду.

На поверхности лежат следующие источники интересной информации:

  • Социальные сети VKontakte, Facebook, Twitter, Instagram и т.п. (масса интересной информации: фото, гео, друзья, интересы, контакты, психологический портрет и т.п.).
  • Сайты судов (если знаем фамилию и место регистрации, то сможем узнать не судится ли человек по базе на сайте конкретного суда).
  • База недействительных паспортов (http://services.fms.gov.ru/info-service.htm?sid=2000).
  • База судебных приставов: не должен ли наш товарищ чего? (http://fssprus.ru/iss/ip/).
  • База дипломов (http://frdocheck.obrnadzor.gov.ru).
  • Google с Яндексом.

Замечание. Зная ник, можно быстро посмотреть в каких социальных сетях существуют соответствующие страницы. Для этого существуют специальные сервисы для проверки доступности страниц, например, namechk.com Забытые пользователем аккаунты иногда бывают намного интересней текущих.

Мощным источником информации может стать поисковик, но чтобы извлечь максимальную пользу начинающему разведчику необходимо освоить так называемые операторы продвинутого поиска, среди которых одними из самых полезных являются: “”, -, cache, site:, filetype:, но это тема для отдельной статьи.

Шаг 3. Сбор данных

В рассматриваемом случае сбор данных будет заключаться в формировании запросов к рассмотренным источникам и сохранении результатов для текущего и последующего сопоставления и анализа. Бывает очень полезно в процессе подобного упражнения открыть текстовый редактор и последовательно сохранять в него обнаруженные данные (скриншоты, текст, фото и т.п.).

Шаг 4. Обработка данных

Иногда чтобы получить ценную информацию нужно покопаться в сырых данных. Примерами обработки могут быть:

  • Извлечение метаданных из документов (авторство, GPS-координаты).
  • Приведение выгрузки данных из социальных сетей к виду, с которым можно работать, например, в том же Excel.
  • и т.п.

Шаг 5. Анализ информации

1. Тестируем гипотезы. Собирая по крупицам информацию, мы сразу же проводим ее анализ и тут снова могут быть полезны гипотезы и их тестирование на жизнеспособность. Сопоставляя с ними выявленные факты, косвенные признаки, логические заключения из фактов, можно определить наиболее вероятную гипотезу.

Факты/СужденияГипотеза 1Гипотеза 2Гипотеза 3Гипотеза 4
Факт 1 + + + +
Факт 2 - + + +
Суждение 1 - - + +
Факт 3 - - - +


2. Элементарные операции с данными: сортировка, сопоставление элементов и т.п. могут открыть массу интересного. Например, можно выгрузить списки друзей друзей интересующего человека и, сопоставив их, определить сообщества, структуры, к которым может иметь и интересующее нас лицо. В этом нелегком деле нам может помочь Excel с его возможностью условного форматирования в случае совпадения элементов.

3. Анализ фото- и видео-изображений. От опытного глаза начинающего интернет-разведчика не уйдут не только случайно попавшие в кадр: вид из окна, часть названия географического пункта или пикантное отражение в зеркале на заднем плане, но и различные невербальные сигналы, которые позволят судить о человеке:

  • складки на лице, открывающие превалирующую эмоцию человека;
  • любимые жесты;
  • характер взаимоотношений с другими людьми и т.п.


4. Анализ содержимого текстов интересующего человека или его собеседников. Обратите внимание на то, как человек описывает свое отношение к другим, что его друзья пишут о нем самом. Тут, конечно, стоит не только уметь внимательно читать, но и знать различного рода тонкости, например, то, что можно в FB искать упоминания о человеке.

5. Анализ лайков. Некоторые ставят лайки всему, что видят, от кого-то лайка никогда не дождешься, но, в основном, люди довольно избирательны в этом деле и вот тут очень интересно посмотреть статистику того, кто или что собирает максимум лайков от нашего человека. Хорошо, что появляются сервисы, позволяющие этот интересный процесс анализа автоматизировать, например, такие как searchlikes.ru

Тема анализа информации очень обширная и интересная, и мы к ней еще не раз вернемся в будущих статьях.

Шаг 6. Подготовка отчета и презентация результатов

Настоящие разведчики много пишут, так как работают на государство. Нам же, так как мы занимаемся подобными вещами исключительно в личных целях и в рамках закона, отчеты строчить не нужно. Тем не менее упражняться в письменном изложении процесса анализа и его результатов очень полезно, так как мы можем тем самым развивать логическое мышление и приобретать навыки анализа текстовой и числовой информации.

Для демонстрации возможностей «продвинутого» поиска Google в качестве целей были выбраны личные аккаунты автора. Сделано это, чтобы никого не обидеть излишним интересом к его частной жизни. Хочу сразу предупредить, что никогда не задавался целью скрыть свое присутствие в интернете, поэтому описанные методы подойдут для сбора данных об обычных людях, и могут быть не очень эффективны для деанонимизации фэйковых аккаунтов, созданных для разовых акций. Интересующимся читателям предлагаю повторить приведенные примеры запросов в отношении своих аккаунтов и оценить насколько легко собирать информацию по ним.

Прежде чем заниматься сбором и анализом информации о конкретном человеке необходимо представить всю картину того, какие данные о человеке существуют.

 

 

Подобную карту нужно детализировать до уровня, необходимого для решения конкретной задачи. Любой поиск информации начинается с некоторого начального набора данных. В нашем случае это будет фамилия, имя и место работы. Остальные данные где-то есть, но связать их с имеющимися мы пока не можем. Поэтому мы формируем гипотезы и проверяем с помощью поисковых запросов.

Источниками информации о человеке могут быть:

  1. он сам: аккаунты в соцсетях, блог и т.п.;
  2. государство: базы данных налоговой, судебных приставов, судов и т.п.
  3. кто-то еще (друзья, враги, СМИ, работодатель и т.п.)

В настоящей статье рассмотрим п.1. – будем вычислять аккаунты автора в социальных сетях.

Цель номер один: ники пользователя

Что такое ник и как мы его выбираем?

Ник представляет собой наше имя в интернете: мы выбираем его, создавая свой личный почтовый ящик, а потом часто используем и в различных сервисах.

Мы ничем не ограничены при выборе ников, но есть любимые алгоритмы формирования наших интернет-имен:

  1. Игры со своим именем: фамилия, имя+фамилия, имя+год рождения, имя+дата, инициалы;
  2. Игры с именами любимых персонажей (tovbender, napoleon);
  3. Немного о себе: профессия, психология (coolhacker, murmur);
  4. Демонстрация увлечений: footballer, boxer;
  5. “Чтобы никто не догадался”: слово наоборот, русское слово в английской раскладке, слово на латыни и т.п.

Если мы не знаем ник, но знаем кое-что о человеке, мы уже можем строить предположения и проверять их.

Хорошим способом вычислить ник пользователя является поиск и анализ его страниц в соцсетях и поиск адреса личной электронной почты.

Начать поиск информации о конкретном пользователе можно с простого запроса, подобного следующему:

джон смит ромашка

где «ромашка» — название компании.

На текущий момент мы должны вспомнить, что некоторые особенности работы поисковика Google:

  • Google читает запрос слева направо.
  • Google не различает регистр: «Земля» и «земля» для него одно и то же;
  • длина запроса не должна превышать 32 слов;
  • * представляет одно слово в запросе;
  • можно искать точную фразу, взяв ее в кавычки;
  • между словами в запросе стоит невидимое логическое «И»;
  • Google сам умеет склонять слова;
  • Оператор «-» исключает из выдачи результаты, которые содержат выражение, помещенное сразу за данным оператором (обязательно без пробела).
  • в верху выдачи находятся страницы, которые, по мнению Google, являются самыми релевантными. Тем не менее это его догадка, так как наших мыслей он читать пока не умеет;
  • для уточнения параметров поиска необходимо владеть операторами продвинутого поиска (advanced search operators).

Теперь можно ввести аналогичный запрос по автору статьи и получить массу страниц, среди которых должна быть и искомые страницы в социальных сетях:

 

Информации в выдаче поисковика достаточно много, и чтобы найти страницы в социальных сетях нам придется пересмотреть большое количество страниц.

Примечание:

Кстати, а что делать, если мы хотим найти человека из определенной компании, но забыли его фамилию? Тут может помочь оператор звездочка:

джон * ромашка

А если мы ищем человека из ООО «Ромашка», а таких «Ромашек» — миллион: и АО «Ромашка», и АНО «Ромашка», и ФГУП «Ромашка» и т.д.

Вариант 1. Искать полную фразу «ООО Ромашка».

Вариант 2. «Минусовать» ненужные слова: -АНО – АО –ФГУП (но так можно «заминусовать» и нужные результаты, например если на странице говорится, что наша «Ромашка» подружилась с ФГУП «Апельсин».

Теперь нам необходимо сузить выдачу и найти страницу автора статьи в социальной сети «ВКонтакте». Это позволит нам определить один из ников пользователя, а затем и вычислить адрес электронной почты. Для этого будет полезно использовать такой оператор, как site. Он ограничивает поиск определенным доменом любого уровня.

 

Вторая ссылка уже ведет на страницу автора статьи в сети «ВКонтакте». Обратите внимание, что автор сознательно выбрал короткий ник: alexdorofeev. Не все интернет-ресурсы дают возможность самим задать ссылку на свою страницу, иногда она формируется автоматически, но может содержать в себе ник, взятый из адреса электронной почты.

Используя добытую информацию и знания, постараемся найти аналогичную страницу в сети Facebook.

Сначала на удачу в браузере введем следующий URL: https://www.facebook.com/alexdorofeev, но, к сожалению, увидим, что страница принадлежит кому-то другому. Тогда воспользуемся проверенным приемом и добавим в запрос site:facebook.com.

В результатах выдачи отсутствует прямая ссылка на профиль, который мы ищем, так как пользователь проявил в свое время бдительность и запретил «сдачу» его странички поисковикам

Здесь необходимо снова сделать небольшое отступление и вспомнить как работают поисковики и в том числе Google.

Что поисковики сделать могут, а что не могут?

Поисковики в общих чертах работают по следующему алгоритму:

  1. боты поисковых машин обходят сайты;
  2. содержимое страниц индексируется;
  3. по запросу пользователей извлекаются ссылки на релевантные страницы.

Поисковики не могут:

  • проиндексировать информацию, доступ к которой возможен только авторизованным пользователям;
  • данные, которые доступны после заполнения форм, например, результаты выгрузки из различных баз данных;
  • качественно извлечь информацию из видео, фото, аудио-материалов.

Еще некоторые нюансы:

  • контекст: результат выдачи зависит от запроса пользователя, от истории его предыдущих запросов и от истории просмотров страницы другими пользователями;
  • поиск осуществляется только на том языке, на котором пользователь ввел свой запрос;
  • имеется некоторый конфликт интересов: поисковики зарабатывают на рекламе, на которую кликают пользователи, потому что нужные им страницы оказались не в самом верху выдачи;
  • действует цензура из-за нарушения чьих-либо прав (авторские, право на забвение и т.п.).

Facebook относится к той категории интернет-ресурсов, которые не очень жалуют индексацию своего сайта и о чем непосредственно сообщают в robots.txt:

Для обнаружения страницы скрытного пользователя на Facebook нам потребуется авторизоваться в данной сети и воспользоваться встроенным функционалом поиска. Ссылка на страницу пользователя может «утечь» и оказаться в выдаче поисковика, но только если пользователь сознательно опубликовал материал за своим авторством на всеобщее обозрение.

С помощью поиска страница автора легко обнаруживается:

Анализируя URL страницы, мы можем определить еще один ник пользователя: adorofeev.

Таким образом, мы уже раздобыли два ника: alexdorofeev и adorofeev. Так как пользователей на популярных ресурсах очень много, то ник может отличаться от того, что реально любит использовать человек, так его «родной» идентификатор уже кем-то занят. По этой причине у автора статьи ник на Хабре: alexdorofeeff, хотя больше нравится adorofeev.

Зная ник, мы можем поискать еще страницы, потенциально связанные с нужным человеком.

Здесь мы снова отвлечемся на Google и вспомним следующие моменты:

  • По умолчанию Google ищет выражение (слово или фразу, взятую в кавычки) во всех частях страницы: в URL, в заголовке, в тексте, в тексте ссылок. В то же время специальные «продвинутые» операторы позволяют указать где именно нам нужно, что бы был искомый текст. Для этого нам необходимо использовать операторы: inurl:, intext:, intitle:, inanchor:, а также их собратьев с приставкой all.
  • Google понимает логические выражения и скобки. AND – логическое «И», по умолчанию именно оно стоит между словами разделенными пробелами в строке поиска. OR или I – логическое «ИЛИ».
  • Если мы применяем оператор, то после двоеточия должно быть искомое выражение без пробела.
  • Операторы с приставкой all позволяют их применить к ряду выражений после двоеточия, разделенных пробелами. Для этих же задач можно использовать операторы без all, но со скобками и логическими выражениями.

Поиграемся с оператором inurl, который ищет страницы, содержащие в URL страницы нужное слово. Так как мы уже знаем несколько ников автора, то можем сделать следующий запрос:

inurl:(adorofeev | alexdorofeeff | alexdorofeev)

В результатах выдачи мы тут же обнаружим страницы соответствующих аккаунтов и часть страниц будет принадлежать автору. Таким образом, если у нас есть предположения об используемых никах, мы можем в самом начале наших изысканий получить список потенциально интересных страниц.

Вспомните новость: Что такое "облака": 5 простых ответов на сложные вопросы

Закрывая тему с никами, хочу обратить ваше внимание на сервисы, позволяющие быстро узнать используется ли данный ник в ряде популярных ресурсов. Так мы можем найти дополнительные страницы конкретного человека. Пример подобного сервиса: https://namechk.com/

Как узнать e-mail?

Теперь, заполучив набор любимых ников пользователя, мы можем попробовать узнать его личный e-mail. Зачем он нужен? Иногда нужно выяснить принадлежит ли конкретный e-mail данному человеку, чтобы определить авторство письма. Также е-mail будет полезен для поиска объявлений, оставленных пользователем на форумах и т.п.

Мы знаем ники, но пока не знаем домены почтовых служб. Так давайте сделаем предположения и проверим. Раз пользователь из России, то вероятнее всего что он использует один или несколько следующих сервисов:

  • Mail.ru
  • Яндекс.Почта
  • Google Gmail
  • Рамблер Почта

Соответственно мы можем сгенерировать адреса (наши гипотезы на данный момент) с никами adorofeev, alexdorofeev и alexdorofeeff.

Как мы можем проверить, а существуют ли подобные адреса на самом деле? Один из вариантов: немного «пообщаться» с почтовыми серверами каждого сервиса по протоколу SMTP:

Шаг 1. Находим почтовый сервер для конкретного домена.

nslookup -type=mx "имя домена"

Шаг 2. Подключаемся к почтовому серверу и имитируем начало отправки сообщения. Если сервер на имя получателя ответит «ОК», значит есть такая учетная запись.

Вариант 1: e-mail существует.

telnet gmail-smtp-in.l.google.com 25

Вариант 2: e-mail не существует.

Верификация e-mail

Определив существуют ли почтовые адреса, мы можем попробовать определить связан ли конкретный адрес с нужным нам человеком.

На mail.ru некоторые пользователи создают свои страницы, к которым можно обратиться следующим образом my.mail.ru/mail/nick/

«Пробиваем» один из адресов:

 

 

Также можно посмотреть страницы пользователей на всех проектах Mail.ru, воспользовавшись комбинацией уже известных нам операторов inurl: и site:

inurl:ник site:mail.ru

Если мы знаем, как выглядит человек, знаем его имя или даже уже нашли его страницу в социальной сети ВКонтакте (наш случай), то задача проверки принадлежности определенного email-адреса значительно упрощается. Мы можем воспользоваться механизмом восстановления доступа к странице. Нам потребуется удача: пользователь с таким адресом должен существовать, ну и разместить свое фото.

Давайте проверим четыре варианта адресов для ника «adorofeev» и увидим, что для двух адресов страниц не существует вовсе, для одного – другое имя:

А вот для соответствующего адреса на Gmail.com мы находим страницу автора:

Итак, мы вычислили реальный личный адрес электронной почты.

Как вычислить корпоративный адрес электронной почты?

Здесь ситуация намного проще. Все дело в том, что многие организации имеют свои правила формирования имен учетных записей электронной почты, которые не отличаются особым разнообразием: инициалы + фамилия, первая буква имени + фамилия и т.п. Нам нужно лишь понять какое правило используется в конкретной компании, чтобы по нему сформировать адрес нужного нам человека.

Вспомните новость: Селфи начали использовать для проверки личности граждан и клиентов компаний

Отправляем в Google запрос следующего вида:

email @домен

Пролистывая результаты выдачи, находим индивидуальные адреса сотрудников и все становится очевидным.

Как вычислить пользователя instagram по гео-меткам?

Теперь попробуем вычислить аккаунт автора в Instagram. Сначала проверяем самые очевидные варианты: https://www.instagram.com/adorofeev/https://www.instagram.com/alexdorofeeff и https://www.instagram.com/alexdorofeev/ Видим, что это не те аккаунты.

Определив, что человек работает в конкретной компании, мы можем искать фотографии с соответствующей гео-меткой. В нашем случае это будет «НПО Эшелон».

Мы видим, что публикации с данной гео-меткой в основной своей массе сделаны сотрудниками компании. Логично предположить, что среди подписчиков многих сотрудников компании «Эшелон» должен быть и аккаунт автора, который мы без труда и находим:

 

Как пользоваться машиной времени?

Проведя аналогичный анализ в отношении аккаунта в twitter, можно обнаружить, что автор вел сайт adorofeev.ru, который сейчас не доступен. Что делать в этой ситуации? Ведь материалы исчезнувшего сайта могут представлять реальный интерес. В практике автора была ситуация, когда подобный исчезнувший сайт содержал опубликованные материалы уголовного дела, с которым было интересно ознакомиться.

Если сайт выключили совсем недавно, то нам может помочь опять таки Google, предлагающий оператор cache: с помощью которого можно извлечь закэшированные страницы, добытые поисковиком.

cache:www.adorofeev.ru/

Мы видим, что сайт 5-го февраля еще был включен, но ничего интересного из себя не представлял.

Очень хочется заглянуть в более далекое прошлое – на несколько лет назад. Для этого подошла бы машина времени и, как ни странно, она есть и доступна любому любознательному пользователю по адресу: https://archive.org/web/

«Пробивая» сайт автора, можно увидеть, что в прошлом там были какие-то материалы:

 

Причем, выбрав определенные даты, можно увидеть контент сайта на конкретный момент:

Вместо заключения: несколько слов об автоматизации процесса и других операторах Google

Можно ли процесс поиска интересной информации с помощью Google автоматизировать? Можно, и неплохие попытки уже есть: скрипт theHarvester.

Надо отметить, что Google это не приветствует и борется, поэтому надежность результатов применения всевозможных скриптов придется дополнительно проверять. Даже просто играясь с вполне легальными операторами, которые мы рассмотрели выше, вы постоянно будете видеть капчу и будете доказывать, что вы не робот.

Статья получилась довольно объемной и мы не стали рассматривать многие другие операторы продвинутого поиска Google , которые могут быть также полезны в интернет-разведке. Если применение операторов в подобном ключе интересно, то мы обязательно продолжим эту тему в одной из следующих статей.

Источник: протокол


Вернуться назад