Недавно попалась статья о том, как используют криминалисты нейронные сети при поиске детской порнографии. Интересным для меня там оказалось, что я ожидал каких то сложных распознавателей, хоть какой то интеллектуальности, но по факту там все очень далеко даже от рефлексии насекомых - просто мега-навороченная математика на одном слое. Вот выдержки:
Какие технологии используют до сих пор следственные органы для поиска детской порнографии?
До сих пор составляются так называемые хэши или контрольные суммы изображений, которые сравниваются с контрольными суммами базы данных с соответствующим образом классифицированным материалом. Это означает, что цвета изображения, структура изображения, распределение цветов кожи записываются с фотографии, создается своего рода отпечаток пальца изображения, контрольная сумма или хэш, а затем выполняется поиск: имеет ли материал базы данных тот же отпечаток пальца?
Как может исскуственный интеллект помочь следователям при поиске детской порнографии?
Вообщем то довольно банально, через число пикселей с их значениями цвета и вычисление вероятности. Если это судебное ПО предназначено для классификации изображения, тогда, как правило, используются нейронные сети, которые работают аналогично человеческому мозгу. Каждое изображение состоит из сотен тысяч пикселей. Каждый пиксель может иметь 256 различных значений цвета. Затем по этим значениям цвета рассчитывается вероятность для всего изображения, что можно увидеть на нем. В зависимости от того, из скольких пикселей состоит изображение, мы имеем дело с 256 в степени 100 000 возможных изображений. Огромное количество. Вероятность того, идет ли тут речь о детской порнографии или нет, зависит от результата соответствия между значениями цвета пикселей и сравниваемым материалом.