Инцидент с индексированием «Яндексом» документов пользователей сервиса Google Docs, похоже, ничему научил российские компании — история получила новый поворот. Эксперт по поисковым системам в Rush Agency Павел Медведев опубликовал на vc.ru статью, в которой рассказал, что с помощью поисковика он нашёл личные данные пользователей сайтов Сбербанка и ВТБ, Единого транспортного портала Москвы и агрегатора билетов Trip.com.
В подтверждение своих слов SEO-специалист опубликовал скриншоты распечаток билетов, данных транзакций, информации о пользователях и даже сканы документов. Одной из причин, почему всё это оказалось в Сети, стало отсутствие файла robots.txt. Того самого, который прописывает параметры индексирования содержания для поисковых машин.
Подобные утечки, по мнению Медведева, происходят из-за недостатка хороших IT-специалистов: многие из них ищут работу в других странах, а не на родине. А современные разработчики считают, что «документ, доступный по длинной уникальной ссылке, надёжно защищён и никогда не попадёт в индекс».
Вины поисковиков здесь практически нет. Эксперт признаёт, что их представители недостаточно освещают механизмы ранжирования и индексации. Да и рекомендации к последней у каждой поисковой системы отличаются. Тем не менее сам робот просто выполняет свою работу, а именно обрабатывает содержание тех страниц, доступ к которым не закрыт. Об этом «Коммерсанту» заявил и представитель «Яндекса», добавив, что вся ответственность в этом случае лежит на владельцах сайтов.
Сбербанк также прокомментировал ситуацию, заявив, что разбирательство по данной ситуации уже началось. При этом, как отметили его представители, данных, которые могут нанести ущерб банку или клиентам, здесь нет.
Чтобы впредь избежать повторения подобных утечек, к решению ситуации должны подойти обе стороны: и поисковики, и крупные компании. Первым необходимо подстроиться под другие способы индексирования, а также объяснить владельцам сайтов принцип работы их механизмов. Компаниям же следует в первую очередь изменить политику конфиденциальности, чтобы избежать утечки любой информации со стороны собственных сотрудников. К тому же разработчики сайтов должны максимально обезопасить важные данные, запретив индексировать их поисковым роботам.
Ранее News.ru писал, что личная информация пользователей сервиса Google Docs стала доступна всем желающим благодаря тому же «Яндексу». С полной хронологией событий вы можете ознакомиться здесь.