Главная » Наука и техника » Слепые люди смогут снова видеть с программой на основе искусственного интеллекта

Слепые люди смогут снова видеть с программой на основе искусственного интеллекта

15196

У ученого Анирадха Коула (Anirudh Koul) дедушка постепенно терял свое зрение. Вернуть глаза пожилому человеку невозможно, но специалист придумал, как видеть предметы без них. Он привлек свои знания, искусственный интеллект и технологии, чтобы создать программу Seeing AI.

Разработка такого программного решения началась несколько лет назад, когда Коул задумался о прогрессе в машинном обучении. Он увидел, что такие технологии могут позволить распознавать предметы вокруг. Два года спустя директор Microsoft Сатья Наделла Satya Nadella презентовал Seeing AI на конференции Build. Разработка вызвала большой интерес: ее показывали даже в Белом доме. «Мы были более потрясены, – говорит Коул. – Мы даже не могли мечтать о такой масштабной заинтересованности. Это вызвало глубокие эмоции».
Очки для слепых2

Работа Коула для многих может показаться мечтой: 80% времени он работает над собственными проектами и идеями. Специалист говорит, что это удобно делать в Microsoft, которая имеет передовые инструменты, большие наборы данных, талантливых сотрудников и инновационный подход. Последний позволяет ученым превращать свои идеи в реальные продукты. «Я не мог желать лучшей карьеры, – говорит Коул. – Если вы страстные, амбициозны и имеете жажду к инновациям, нет лучшего места для вас, чем Microsoft».

Ирен Чен (Irene Chen) показывает «умные» очки от Pivothead

Очки для слепых

Программа Seeing AI является одной из многих революционных технологий, которые создали в Microsoft благодаря технологиям машинного обучения. Эта утилита работает на смартфоне и использует «умные» очки от Pivothead. Она привлекает компьютерное зрение, распознавание речи, чтобы описывать окружение для слепого человека, читать ей текст, отвечать на вопросы, распознавать эмоции на лицах. Краткий анализ, например, может рассказать, что пользователь смотрит на собаку, которая играет с фрисби, на очередь возле карусели выдачи багажа или на человека, который улыбается.

Одной из первых испытать Seeing AI смогла студентка Университета Британской Колумбии Ирен Чен в рамках программы Garage Internship Program. В ней интерны четыре месяца занимаются разработкой новых продуктов. Сначала Чен хотела просто узнать больше о компьютерное видение, но смогла сделать больше, приобщившись к Seeing AI. Особенно интерна поразили испытания разработки слепым человеком. «Она некоторое время привыкала, но потом читала, что хотела. Ее лицо сияло, – вспоминает Чен. – Это был поворотный момент для меня. Я почувствовала, что моя работа действительно важна. Я такого раньше не испытывала».

Чен работала над разработкой серверной части. По ее словам, там происходит вся магия алгоритмов. Вместе с ней над проектом также работают специалисты из офисов Microsoft в Японии, Сербии, Каире, Лондоне, Вашингтоне и Калифорнии. «Каждый раз, как мы посылали письма командам во всем мире и просили о помощи, они с радостью откликались. Даже несмотря на то, что они не принимали прямого участия в проекте, – говорит она. – Это было невероятно».

Коул также говорит, что значение подобной открытости трудно переоценить. «Можно открыть список внутренних групп и сказать, что у тебя есть проблема. Через один-два часа получишь ответ от пяти людей из разных уголков планеты, которые являются экспертами в этой области, – рассказывает он. – Это как бы мгновенное решение проблем».

Сам Коул заинтересовался технологиями еще в детстве в Индии. Его родители купили компьютер на базе операционной системы MS-DOS с черно-белым экраном. Они мало пользовались приобретенным девайсом, тогда как Коул начал писать на нем программы. Он получил диплом в компьютерных науках в Университете Далхосі в Канаде и работал четыре года инженером в Yahoo. Затем Коул пошел в Университет Карнеги-Меллон, чтобы получить диплом магистра в обработке данных. «Я был полностью погружен в программы с открытым кодом, Linux и стартапы, – говорит он. – Мне казалось, что Microsoft была словно бегемотом, который медленно движется».

Все изменилось, когда с Коулом связался рекрутер Microsoft. Специалист пошел на интервью и сразу понял, что его прежние мысли были ошибочными. «Люди, которых я встречал, имели дух хакерства, – говорит он. – Они также имели огромные объемы данных, которые было трудно получить в любой другой компании». В свой первый день в Microsoft он запустил программу, которая исполнялась два часа на кластере из тысячи компьютеров. На домашнем ПК, вспоминает Коул, это продолжалось семь месяцев. «Они сделали инструменты доступными, поэтому ученый из обработки данных может очень быстро проводить итерации и получать ответы», – говорит он.

Проект Seeing AI зародился для прошлогоднего однонедельного хакатону. Коул поделился своей идеей с коллегами, которые работали с организациями для слепых. Многим его предложение показалось слишком амбициозной, но ему удалось собрать команду из 16 участников с разных офисов Microsoft. «С прогрессом в компьютерном видении и машинном обучении я знал, что мы сможем создать что-то более полезное, чем уже существует», – говорит он.

Подобную идею также пробовал воплотить Саквіб Шаїх (Saqib Shaikh) из офиса Microsoft в Лондоне. Он работает программным инженером и слепой с 7 лет. Как только Шаїх узнал о проекте Коула, он связался с ним. «Мы говорили часами о разные идеи и технологии», – вспоминает Шаїх.

Проект Seeing AI соревновался с 13 тысячами других участников и выиграл в категории «Технологии ради лучшего». «Это было невероятно, – делится Шаїх. – Мы решили, что этим стоит заниматься. Мы хотели достичь успеха независимо от чего-то. Победа в хакатоні была ягодкой на торте».

После хакатону команда продолжила работу над проектом. Начальники Шаиха увидели его страсть и дали ему два месяца на работу с Seeing AI. Коул также привлек к работе интернов исследовательской лаборатории Garage.

Microsoft предоставила возможность непосредственно работать с сообществами слепых, доступ к больших вычислительных ресурсов и возможность демонстрировать работу всему миру, – говорит участница проекта Маргарет Митчелл (Margaret Mitchell). – Больше нет такого места, которое сочетает свободу и ресурсы».

Коул говорит, что проект, скорее всего, не имел бы будущего вне Microsoft. «Я видел много разработок для людей с ограниченными возможностями, которые бы не вышли, если бы их разрабатывали вне Microsoft, – говорит он. – Доступность глубоко встроенная в нашу культуру. Она поощряет людей думать, как сделать вещи восприимчивыми для всего общества».

Проект Seeing AI является лишь началом, ведь специалисты имеют много хороших идей. Дедушка Коула мало знал про этот проект, но он был поражен тем, над чем работает его внук. Сам Коул благодарен, что может превращать свои идеи в реальные продукты. «В чем интерес работать, если ты не увидишь воплощение идеи в жизнь?», – говорит он.

Оставить комментарий

Ваш email нигде не будет показанОбязательные для заполнения поля помечены *

*