За волшебной дверью...
Dec. 11th, 2017 12:53 pmЕсть у Артура Конан Дойля маленькое эссе Through the Magic Door, 1907.
But then no man ever does realize the true interest of the age in which he happens to live. All sense of proportion is lost, and the little thing hard-by obscures the great thing at a distance. It is easy in the dark to confuse the fire-fly and the star. Fancy, for example, the Old Masters seeking their subjects in inn parlours, or St. Sebastians, while Columbus was discovering America before their very faces.
Мол, "Люди не понимают истинной сути эпохи, малюют трактиры и Св.Себастьянов, пока Колумб открывает Америку"...
Так и сегодня - что в новостях: чаще всего совершаемые мигрантами преступления (крадут, торгуют дурью, грабят...), госпремия правозащитнице (и что удивляться молчанию при закрытии сельских больниц, но призывам к милости по поводу сенаторов...), балет про невозвращенцев; все, как всегда...
А вот маленькая статья в arxiv.org проходит так, в фоновом режиме. Хотя наиболее интересна именно она:
Learning Transferable Architectures for Scalable Image Recognition
В мае 2017 Google Brain представил конструктор моделей машинного обучения AutoML. Ну а 1 декабря 2017 года был опубликован отчет о сгенерированной им сети NASNet. Которая распознает и классифицирует объекты из баз ImageNet и COCO лучше, чем любая нейросеть, сделанная людьми.
Всё - даже в конструировании ИскИнов человек уступил своим инструментам!
But then no man ever does realize the true interest of the age in which he happens to live. All sense of proportion is lost, and the little thing hard-by obscures the great thing at a distance. It is easy in the dark to confuse the fire-fly and the star. Fancy, for example, the Old Masters seeking their subjects in inn parlours, or St. Sebastians, while Columbus was discovering America before their very faces.
Мол, "Люди не понимают истинной сути эпохи, малюют трактиры и Св.Себастьянов, пока Колумб открывает Америку"...
Так и сегодня - что в новостях: чаще всего совершаемые мигрантами преступления (крадут, торгуют дурью, грабят...), госпремия правозащитнице (и что удивляться молчанию при закрытии сельских больниц, но призывам к милости по поводу сенаторов...), балет про невозвращенцев; все, как всегда...
А вот маленькая статья в arxiv.org проходит так, в фоновом режиме. Хотя наиболее интересна именно она:
Learning Transferable Architectures for Scalable Image Recognition
В мае 2017 Google Brain представил конструктор моделей машинного обучения AutoML. Ну а 1 декабря 2017 года был опубликован отчет о сгенерированной им сети NASNet. Которая распознает и классифицирует объекты из баз ImageNet и COCO лучше, чем любая нейросеть, сделанная людьми.
Всё - даже в конструировании ИскИнов человек уступил своим инструментам!
no subject
Date: 2017-12-11 10:20 am (UTC)Т.е запускаешь ее на компе человека, пока он отошел - и затем чел вернувшись нажав любую клавишу видит имитацию удаления. И клавиатура на его команды не реагирует.
Поставили мы эту программку своей начальнице. Коллектив был демократичный. И стали предвкушать - что она сделает.
Так она нас обломала тем - что когда у нее имитация удаления пошла - она просто в панике выключила комп из розетки.
Так что мы еще посмотрим, где у него вилка с розеткой!
no subject
Date: 2017-12-11 12:26 pm (UTC)https://www.technologyreview.com/the-download/609595/artificial-intelligence-can-translate-languages-without-a-dictionary/?utm_source=facebook.com&utm_medium=social&utm_content=2017-11-29&utm_campaign=Technology+Review
То есть, учим переводить без использования параллельных мест - по качеству обратного перевода.
Хотя, у белковых есть последняя линия обороны - до массы данных попросту не добраться. Хотя, не исключено, что без них вполне можно обойтись
no subject
Date: 2017-12-11 04:37 pm (UTC)no subject
Date: 2017-12-11 12:31 pm (UTC)В паре английский-русский максимум коряво примитивную газетную статью могут перевести боле менее. И то с ошибками.
Тот же приведенный отрывок Конан Дойля - Гугл уже переводит с грубыми ошибками искажающими смысл.
А уж если взять английский-китайский - то это будет просто кромешный ад.
Вот тебе и лучше чем человек, модные нейросети (которые в общем то просто изощренный алгоритм перебора из огромной, самопополняемой базы данных).
no subject
Date: 2017-12-11 01:42 pm (UTC)no subject
Date: 2017-12-11 02:05 pm (UTC)но я допустим зная английский в общем так себе на троечку максимум - при переводе смысл не теряю.
Перевод у меня будет корявый, но не искажающий местами первоначальный текст автора.
Или как минимум я буду осознавать, что такую то фразу я не понял.
А в переводе Гугла я с ходу вижу две ошибки грубо искажающие смысл. И ошибки эти в рамках школьной программы обычной школы. Там нет ничего сверхсложного.
P.S. А уж если брать вариант английский-китайский, что у Гугл, что у Яндекс, - то там будет вообще уровень типа "Я твой дом трубу шатал".
no subject
Date: 2017-12-11 02:23 pm (UTC)Ну, как обычно - «во-первых, это красиво»
Тут параллельно подвис пост из-за ссылки, там занимательный подход к переводу - без параллельных мест, на качестве обратного перевода.
no subject
Date: 2017-12-11 05:50 pm (UTC)Кажется, что так было всегда, но недавно совсем.
no subject
Date: 2017-12-11 07:35 pm (UTC)Такой ведь тезис выдвигался.
no subject
Date: 2017-12-12 01:29 am (UTC)(2029 год упоминается)
no subject
Date: 2017-12-12 09:54 am (UTC)no subject
Date: 2017-12-11 05:23 pm (UTC)Доступные за приличные деньги для корпоративного пользования переводческие программы техдокументацию берут отлично.
А худлит не нужен никому.
no subject
Date: 2017-12-11 05:48 pm (UTC)Грустно как-то...
no subject
Date: 2017-12-11 07:37 pm (UTC)Она далеко не универсальна.
Техническую литературу, если ты знаешь специфику и термины в общем то проще в алгоритм перевода загнать. Там устойчивые выражения и простое построение фраз.
Я по программированию -если тема знакомая -не особо напрягаясь английские книги читаю. Хотя в общем то любитель в предмете.
А дай мне какого нибудь Диккинса - я на втором листе умру.
no subject
Date: 2017-12-11 07:32 pm (UTC)Базу данных там периодически профессиональные переводчики правят. Под конкретные темы.
Поэтому они такие и узко заточенные.
Речь то шла о том что нейросети во всем превзошли человека.
no subject
Date: 2017-12-11 08:22 pm (UTC)Переводчики вообще крайне редко участвуют в создании систем автоматического перевода.
Промышленная лингвистика очень своеобразно устроена.
no subject
Date: 2017-12-11 08:34 pm (UTC)Люди ни слова не знающие по английски?
А тестирует перевод на адекватность кто - на этапе разработки, просто чел с улицы не знающий язык?
no subject
Date: 2017-12-11 08:51 pm (UTC)Есть лингвисты (русские), которые хорошо знают английский и не понимают, зачем вообще и кому нахрен сдался русский.
Вот они в среднем и занимаются разработкой систем автоматического перевода на русский язык.
У переводчиков и лингвистов принципиально разное образование и в среднем разная идеология.
no subject
Date: 2017-12-11 08:59 pm (UTC)Но в любом случае, я как то сомневаюсь, что такие гиганты как Гугл или яндекс - не могли бы перекупить технологию перевода на корню и прикрутить у себя. Для них это просто копейки.
У них монетизация не прямая - они могут позволить себе сервис с отличным качеством бесплатным держать.
no subject
Date: 2017-12-11 09:07 pm (UTC)Гигант, где зарплаты у сотрудников по 25 тыщ рублей.
no subject
Date: 2017-12-11 09:12 pm (UTC)Но оставим один Гугл. Уж он то точно не карлик.
no subject
Date: 2017-12-11 11:03 pm (UTC)Да и в гиганте зарплаты будут пониже просто потому что народу много и классификация точнее. А еще есть работы которых нет нигде, из-за своего масштаба.
Впрочем, в интересующей меня области и зарплатах - 100+ людей там хватает, но я пока сторонюсь совсем гигантов, обитая в уютном тихом болотце.
no subject
Date: 2017-12-11 11:42 pm (UTC)no subject
Date: 2017-12-12 12:10 am (UTC)Впрочем, совершенно с вами согласен, с русским языком у меня так себе - со школы пошло. Пришлось найти область, в которой мои хромающие знания русского языка не доставляют мне неудобств. А с машинами у меня взаимопонимание гораздо лучше - тем и живу.
no subject
Date: 2017-12-12 10:39 am (UTC)no subject
Date: 2017-12-13 07:59 am (UTC)В "Магните" мерчендайзеру с порога 30 дают.
А в Яндексе лингвисту с во -- 25.
no subject
Date: 2017-12-13 09:44 am (UTC)