Як «пробити» людини в Інтернет: використовуємо оператори Google і логіку

У черговій статті нашого циклу публікацій, присвяченого інтернет-розвідки, розглянемо, як оператори просунутого пошуку Google (advanced search operators) дозволяють швидко знаходити необхідну інформацію про конкретну людину.
У коментарях до першої нашої статті, читачі просили побільше практичних прикладів і скріншотів, тому в цій статті практики і графіки будемо багато. Для демонстрації можливостей «просунутого» пошуку Google в якості цілей були обрані особисті акаунти автора. Зроблено це, щоб нікого не образити надмірним інтересом до його приватного життя. Хочу відразу попередити, що ніколи не задавався метою приховати свою присутність в інтернеті, тому описані методи підійдуть для збору даних про звичайних людей, і можуть бути не дуже ефективні для деанонімізація фэйковых акаунтів, які створені для разових акцій. Зацікавленим читачам пропоную повторити наведені приклади запитів щодо своїх акаунтів і оцінити наскільки легко збирати інформацію по ним.

Перш ніж займатися збором і аналізом інформації про конкретну людину необхідно уявити всю картину того, які дані про людину існують.

Подібну карту потрібно деталізувати до рівня, необхідного для рішення конкретної задачі. Будь-пошук інформації починається з деякого початкового набору даних. В нашому випадку це буде прізвище, ім'я та місце роботи. Інші дані десь є, але зв'язати їх з наявними ми поки не можемо. Тому ми формуємо гіпотези і перевіряємо за допомогою пошукових запитів.
Джерелами інформації про людину можуть бути:
  1. він сам: акаунти в соцмережах, блог тощо;
  2. держава: бази даних податкової, судових приставів, судів і т. п. Див. посилання в статті
  3. хтось ще (друзі, вороги, ЗМІ, роботодавець тощо)
У цій статті розглянемо п. 1. – будемо обчислювати акаунти автора в соціальних мережах.
Мета номер один: нікі користувача
Що таке нік і як ми його вибираємо?
Нік являє собою наше ім'я в інтернеті: ми обираємо його, створюючи свій особистий поштову скриньку, а потім часто використовуємо і в різних сервісах.
Ми нічим не обмежені при виборі ників, але є улюблені алгоритми формування наших інтернет-імен:
  1. Ігри зі своїм ім'ям: прізвище, ім'я+прізвище, ім'я+рік народження, ім'я+дата, ініціали;
  2. Ігри з іменами улюблених персонажів (tovbender, napoleon);
  3. Трохи про себе: професія, психологія (coolhacker, murmur);
  4. Демонстрація захоплень: footballer, boxer;
  5. «Щоб ніхто не здогадався»: слово навпаки, російське слово в англійській розкладці, слово латиною і т. п.
Якщо ми не знаємо нік, але знаємо дещо про людину, ми вже можемо будувати припущення і перевіряти їх.
Хорошим способом обчислити нік користувача є пошук та аналіз його сторінок в соцмережах і пошук адреси особистої електронної пошти.
Почати пошук інформації про конкретного користувача можна з простого запиту, подібного до наступного:
джон смітт ромашка

де «ромашка» — назва компанії.
На поточний момент ми повинні згадати, що деякі особливості роботи пошукача Google:
  • Google читає запит зліва направо.
  • Google не розрізняє регістр: «Земля» і «земля» для нього одне і те ж;
  • довжина запиту не повинна перевищувати 32 слів;
  • * представляє одне слово в запиті;
  • можна шукати точну фразу, взявши її в лапки;
  • між словами в запиті варто невидиме логічне «І»;
  • Google сам вміє схиляти слова;
  • Оператор «-» виключає з видачі результати, які містять вираз, поміщене відразу за даним оператором (обов'язково без пробілу).
  • верху видачі знаходяться сторінки, які, на думку компанії, є найбільш релевантними. Тим не менш, це його здогад, так як наших думок він читати ще не вміє;
  • для уточнення параметрів пошуку необхідно володіти операторами просунутого пошуку (advanced search operators).
Тепер можна ввести аналогічний запит автору статті і отримати масу сторінок, серед яких має бути й шукані сторінки в соціальних мережах:


Інформації у видачі пошуковика досить багато, і щоб знайти сторінки в соціальних мережах нам доведеться переглянути велику кількість сторінок.
Примітка:
до Речі, а що робити, якщо ми хочемо знайти людину з певної компанії, але забули його прізвище? Тут може допомогти оператор зірочка:
джон * ромашка

А якщо ми шукаємо людину з ТОВ «Ромашка», а таких «Ромашок» — мільйон: і АТ «Ромашка», і АНО «Ромашка», і ФГУП «Ромашка» і т. д.
Варіант 1. Шукати повну фразу «ТОВ Ромашка».
Варіант 2. «Мінусувати» непотрібні слова: -АНО – АТ –ФГУП (але так можна «заминусовать» і потрібні результати, наприклад, якщо на сторінці сказано, що наша «Ромашка» подружилася з ФГУП «Апельсин».
Тепер нам необхідно звузити видачу і знайти сторінку автора статті в соціальній мережі «ВКонтакте». Це дозволить нам визначити один з ніків користувача, а потім і обчислити адресу електронної пошти. Для цього буде корисно використовувати такий оператор site. Він обмежує пошук певним доменом будь-якого рівня.


Друга посилання веде на сторінку автора статті у мережі «ВКонтакте». Зверніть увагу, що автор свідомо вибрав короткий нік: alexdorofeev. Не всі інтернет-ресурси дають можливість самим поставити посилання на свою сторінку, іноді вона формується автоматично, але може містити в собі нік, взятий з адреси електронної пошти.
Використовуючи здобуту інформацію і знання, постараємося знайти аналогічну сторінку в мережі Facebook.
Спочатку на удачу в браузері введемо наступний URL: https://www.facebook.com/alexdorofeev, але, на жаль, побачимо, що сторінка належить комусь іншому. Тоді скористаємося перевіреним прийомом і додамо в запит site:facebook.com.


В результатах видачі відсутнє пряме посилання на профіль, який ми шукаємо, так як користувач виявив у свій час пильність і заборонив «здачу» його сторінки пошуковикам


Тут необхідно зробити невеликий відступ і згадати як працюють пошукові системи і в тому числі Google.
Що пошукачі можуть зробити, а що не можуть?
Пошуковики в загальних рисах працюють за наступним алгоритмом:
  1. боти пошукових машин обходять сайти;
  2. вміст сторінок індексується;
  3. за запитом користувачів витягуються посилання на релевантні сторінки.
Пошуковці не можуть:
  • проіндексувати інформацію, доступ до якої можливий лише авторизованим користувачам;
  • дані, які доступні після заповнення форм, наприклад, результати вивантаження з різних баз даних;
  • якісно витягти інформацію з відео, фото, аудіо-матеріалів.
Ще деякі нюанси:
  • контекст: результат видачі залежить від запиту користувача, від історії його попередніх запитів і від історії переглядів сторінки іншими користувачами;
  • пошук здійснюється тільки на тій мові, на якому користувач ввів свій запит;
  • є певний конфлікт інтересів: пошуковики заробляють на рекламі, на яку користувачі клацають, тому що потрібні їм сторінки виявилися не в самому верху видачі;
  • цензура діє через порушення чиїх-небудь прав (авторські, право на забуття і тощо).
Facebook відноситься до тієї категорії інтернет-ресурсів, які не дуже полюбляють індексацію сайту і про що безпосередньо повідомляють в robots.txt:

Для виявлення сторінки скритного користувача на Facebook нам потрібно авторизуватися в даній мережі і скористатися вбудованим функціоналом пошуку. Посилання на сторінку користувача може «втекти» і опинитися у видачі пошуковика, але тільки якщо користувач свідомо опублікував матеріал за своїм авторством на загальний огляд.
За допомогою пошуку сторінка автора легко виявляється:

Аналізуючи URL сторінки, ми можемо визначити ще один нік користувача: adorofeev.
Таким чином, ми вже роздобули два ніка: alexdorofeev і adorofeev. Так як користувачів на популярних ресурсах дуже багато, то нік може відрізнятися від того, що реально любить використовувати людина, так його «рідний» ідентифікатор вже кимось зайнятий. З цієї причини у автора статті нік на Хабре: alexdorofeeff, хоча більше подобається adorofeev.
Знаючи нік, ми можемо пошукати ще сторінки, потенційно пов'язані з потрібною людиною.
Тут ми знову відволічемося на Google і згадаємо наступні моменти:
  • За замовчуванням Google шукає вираз (слово або фразу, взяту в лапки) у всіх частинах сторінки: в URL, в заголовку, тексті, в тексті посилань. У той же час спеціальні «просунуті» оператори дозволяють вказати де саме нам потрібно, що б був потрібний текст. Для цього нам необхідно використовувати оператори: inurl:, intext:, intitle:, inanchor:, а також їх побратимів з приставкою all.
  • Google розуміє логічні вирази та дужки. AND – логічне «І», за замовчуванням саме воно стоїть між словами розділені пробілами в рядку пошуку. OR або I – логічне «АБО».
  • Якщо ми застосовуємо оператор, то після двокрапки має бути шукане вираз без пробілу.
  • Оператори з приставкою all дозволяють їх застосувати до ряду виразів після двокрапки, розділених пробілами. Для цих завдань можна використовувати оператори без all, але з дужками і логічними виразами.
Пограємося з оператором inurl, який шукає сторінки, що містять в URL сторінки потрібне слово. Так як ми вже знаємо кілька ніків автора, то можемо зробити наступний запит:
inurl:(adorofeev | alexdorofeeff | alexdorofeev)

В результатах видачі ми відразу ж виявимо сторінки відповідних облікових записів і частина сторінок буде належати автору. Таким чином, якщо у нас є припущення про никах, ми можемо в самому початку наших досліджень отримати список потенційно цікавих сторінок.
Закриваючи тему з ніками, хочу звернути вашу увагу на сервіси, що дозволяють швидко дізнатися використовується даний нік в ряді популярних ресурсів. Так ми можемо знайти додаткові сторінки конкретної людини. Приклад подібного сервісу: памесһк.сом

Як дізнатися e-mail?
Тепер, отримавши набір улюблених ніків користувача, ми можемо спробувати дізнатися його особистий e-mail. Навіщо він потрібен? Іноді потрібно з'ясувати чи належить конкретний e-mail даній людині, щоб визначити авторство листа. Також е-mail буде корисний для пошуку оголошень, залишених користувачем на форумах і т. п.
Ми знаємо ніки, але поки не знаємо домени поштових служб. Так давайте зробимо припущення і перевіримо. Раз користувач з Росії, то найімовірніше, що він використовує один або декілька наступних сервісів:
  • Mail.ru
  • Яндекс.Пошта
  • Google Gmail
  • Рамблер Пошта
Відповідно ми можемо згенерувати адреси (наші гіпотези на даний момент) з ніками adorofeev, alexdorofeev і alexdorofeeff.
Як ми можемо перевірити, а чи існують подібні адреси насправді? Один з варіантів: трохи «поспілкуватися» з поштовими серверами кожного сервісу по протоколу SMTP:
Крок 1. Знаходимо поштовий сервер для конкретного домену.
nslookup -type=mx "ім'я домену"

Крок 2. Підключаємося до поштового сервера і імітуємо початок надсилання повідомлення. Якщо сервер на ім'я одержувача відповість «ОК», значить є така обліковий запис.
Варіант 1: e-mail існує.
telnet gmail-smtp-in.l.google.com 25

Варіант 2: e-mail не існує.

Верифікація e-mail
Визначивши існують поштові адреси, ми можемо спробувати визначити, пов'язаний чи конкретну адресу з потрібним нам людиною.
На mail.ru деякі користувачі створюють свої сторінки, до яких можна звернутися наступним чином my.mail.ru/mail/nick/
«Пробиваємо» один з адрес:

Також можна переглянути сторінки користувачів на всіх проектах Mail.ru скориставшись комбінацією вже відомих нам операторів inurl: і site:
inurl:нік site:mail.ru

Якщо ми знаємо, як виглядає людина, знаємо його ім'я або навіть вже знайшли його сторінку в соціальній мережі ВКонтакте (наш випадок), то завдання перевірки належності певного email-адреси значно спрощується. Ми можемо скористатися механізмом відновлення доступу до сторінки. Нам знадобиться удача: користувач з такою адресою має існувати, ну і розмістити своє фото.
Давайте перевіримо чотири варіанти адрес для ніка «adorofeev» і побачимо, що для двох адрес сторінок не існує зовсім, для одного – інше ім'я:

А ось для відповідного адреси на Gmail.com ми знаходимо сторінку автора:

Отже, ми вирахували реальний особистий адресу електронної пошти.
Як обчислити корпоративний адресу електронної пошти?
Тут ситуація набагато простіше. Вся справа в тому, що багато організацій мають свої правила формування імен облікових записів електронної пошти, які не відрізняються особливою різноманітністю: ініціали + прізвище, перша літера імені + прізвище і т. п. Нам потрібно лише зрозуміти, яке зазвичай використовується в конкретній компанії, щоб за нього сформувати адресу потрібного нам людини.
Відправляємо в Google запит наступного виду:
email @домен

Гортаючи результати видачі, знаходимо індивідуальні адреси співробітників і все стає очевидним.


Як обчислити користувача instagram за гео-мітках?
Тепер спробуємо обчислити акаунт автора в Instagram. Спочатку перевіряємо найбільш очевидні варіанти: https://www.instagram.com/adorofeev/, https://www.instagram.com/alexdorofeeff і https://www.instagram.com/alexdorofeev/ Бачимо, що це не ті акаунти.
Визначивши, що людина працює в конкретній компанії, ми можемо шукати фотографії з відповідною гео-тег. В нашому випадку це буде «НВО Ешелон».

Ми бачимо, що публікації з даної гео-міткою в основній своїй масі зроблені співробітниками компанії. Логічно припустити, що серед передплатників багатьох співробітників компанії «Ешелон» повинен бути обліковий запис автора, який ми без праці і знаходимо:

Як користуватися машиною часу?
Провівши аналогічний аналіз щодо акаунта в twitter, можна виявити, що автор вів сайт adorofeev.ru, який зараз не доступний. Що робити в цій ситуації? Адже матеріали зниклого сайту можуть представляти реальний інтерес. У практиці автора була ситуація, коли подібний зниклий сайт містив опубліковані матеріали кримінальної справи, з якими було цікаво познайомитися.
Якщо сайт вимкнули зовсім недавно, то нам може допомогти знову таки Google, пропонує оператор cache: з допомогою якого можна отримати закэшированные сторінки, здобуті пошукачем.
cache:www.adorofeev.ru/

Ми бачимо, що сайт 5-го лютого ще був включений, але нічого цікавого з себе не представляв.

Дуже хочеться зазирнути в минуле – на кілька років назад. Для цього підійшла б машина часу і, як не дивно, вона є і доступна кожному допитливому користувачеві за адресою: https://archive.org/web/
«Пробиваючи» сайт автора, можна побачити, що в минулому там були якісь матеріали:

Причому, вибравши певні дати, можна побачити контент сайту на конкретний момент:

Замість висновку: кілька слів про автоматизацію процесу та інших операторах Google
Можна процес пошуку цікавої інформації з допомогою Google автоматизувати? Можна, і непогані спроби вже є: скрипт theHarvester.
Треба відзначити, що Google це не вітає і бореться, тому надійність результатів застосування різних скриптів доведеться додатково перевіряти. Навіть просто граючись з цілком легальними операторами, які ми розглянули вище, ви постійно будете бачити капчу і будете доводити, що ви не робот.
Стаття вийшла досить об'ємною і ми не стали розглядати багато інших оператори просунутого пошуку Google , які можуть бути корисні в інтернет-розвідки. Якщо застосування операторів в подібному ключі цікаво, то ми обов'язково продовжимо цю тему в одній з наступних статей.
Література
  1. Що в імені тобі моєму: як якісно «пробити» людини в мережі Інтернет?
  2. Інтернет-розвідка в дії: who is Mr./Ms. Habraman?
  3. Social Media in Identifying Threats to Ensure Safe Life in a Modern City Aleksandr Dorofeev, Alexey Markov, Valentin Tsirlov
  4. Google Hacking for Penetration Тестерів, Third Edition 3rd Edition by Johnny Long, Bill Gardner, Justin Brown.

Джерело: Хабрахабр

0 коментарів

Тільки зареєстровані та авторизовані користувачі можуть залишати коментарі.