[personal profile] thagastan
Есть у Артура Конан Дойля маленькое эссе Through the Magic Door, 1907.

But then no man ever does realize the true interest of the age in which he happens to live. All sense of proportion is lost, and the little thing hard-by obscures the great thing at a distance. It is easy in the dark to confuse the fire-fly and the star. Fancy, for example, the Old Masters seeking their subjects in inn parlours, or St. Sebastians, while Columbus was discovering America before their very faces.

Мол, "Люди не понимают истинной сути эпохи, малюют трактиры и Св.Себастьянов, пока Колумб открывает Америку"...

Так и сегодня - что в новостях: чаще всего совершаемые мигрантами преступления (крадут, торгуют дурью, грабят...), госпремия правозащитнице (и что удивляться молчанию при закрытии сельских больниц, но призывам к милости по поводу сенаторов...), балет про невозвращенцев; все, как всегда...

А вот маленькая статья в arxiv.org проходит так, в фоновом режиме. Хотя наиболее интересна именно она:
Learning Transferable Architectures for Scalable Image Recognition

В мае 2017 Google Brain представил конструктор моделей машинного обучения AutoML. Ну а 1 декабря 2017 года был опубликован отчет о сгенерированной им сети NASNet. Которая распознает и классифицирует объекты из баз ImageNet и COCO лучше, чем любая нейросеть, сделанная людьми.
Всё - даже в конструировании ИскИнов человек уступил своим инструментам!

Date: 2017-12-11 10:20 am (UTC)
From: [identity profile] Алекс Шорн (from livejournal.com)
В середине 90-х была помню какая то программка-шутка, которая под Нортон имитировала стирание всех файлов с компьютера и форматирование жесткого диска.

Т.е запускаешь ее на компе человека, пока он отошел - и затем чел вернувшись нажав любую клавишу видит имитацию удаления. И клавиатура на его команды не реагирует.

Поставили мы эту программку своей начальнице. Коллектив был демократичный. И стали предвкушать - что она сделает.
Так она нас обломала тем - что когда у нее имитация удаления пошла - она просто в панике выключила комп из розетки.

Так что мы еще посмотрим, где у него вилка с розеткой!

Date: 2017-12-11 12:26 pm (UTC)
From: [identity profile] photo-viewer.livejournal.com
Из недавно восхитившего:
https://www.technologyreview.com/the-download/609595/artificial-intelligence-can-translate-languages-without-a-dictionary/?utm_source=facebook.com&utm_medium=social&utm_content=2017-11-29&utm_campaign=Technology+Review
То есть, учим переводить без использования параллельных мест - по качеству обратного перевода.

Хотя, у белковых есть последняя линия обороны - до массы данных попросту не добраться. Хотя, не исключено, что без них вполне можно обойтись

Date: 2017-12-11 04:37 pm (UTC)
From: [identity profile] thagastan.livejournal.com
Это сильнее, чем компьютеру в го самому с собой играть...

Date: 2017-12-11 12:31 pm (UTC)
From: [identity profile] Алекс Шорн (from livejournal.com)
К слову сказать - адекватного переводчика ни Гугл , ни Яндекс так и не создали.

В паре английский-русский максимум коряво примитивную газетную статью могут перевести боле менее. И то с ошибками.
Тот же приведенный отрывок Конан Дойля - Гугл уже переводит с грубыми ошибками искажающими смысл.

А уж если взять английский-китайский - то это будет просто кромешный ад.

Вот тебе и лучше чем человек, модные нейросети (которые в общем то просто изощренный алгоритм перебора из огромной, самопополняемой базы данных).
Edited Date: 2017-12-11 12:58 pm (UTC)

Date: 2017-12-11 01:42 pm (UTC)
From: [identity profile] photo-viewer.livejournal.com
Так а с чем сравнивать? С переводами Райт-Ковалевой?

Date: 2017-12-11 02:05 pm (UTC)
From: [identity profile] Алекс Шорн (from livejournal.com)
Я не знаю, кто такая Райт-Ковалева,

но я допустим зная английский в общем так себе на троечку максимум - при переводе смысл не теряю.
Перевод у меня будет корявый, но не искажающий местами первоначальный текст автора.

Или как минимум я буду осознавать, что такую то фразу я не понял.

А в переводе Гугла я с ходу вижу две ошибки грубо искажающие смысл. И ошибки эти в рамках школьной программы обычной школы. Там нет ничего сверхсложного.

P.S. А уж если брать вариант английский-китайский, что у Гугл, что у Яндекс, - то там будет вообще уровень типа "Я твой дом трубу шатал".
Edited Date: 2017-12-11 02:11 pm (UTC)

Date: 2017-12-11 02:23 pm (UTC)
From: [identity profile] photo-viewer.livejournal.com
Это переводчица была очень хорошая. Есть, безусловно, немаленький слой людей , чей перевод аккуратнее машинного. И гигантский слой , которому «твой дом труба шатал» - недостижимый уровень. Оценка качества текстов вообще сильно нетривиальная задача, даже без перевода. Доступному сейчас машинному переводу есть куда улучшаться. Но скепсис мне понятен , скажем, в датах, не в направлении.

Ну, как обычно - «во-первых, это красиво»
Тут параллельно подвис пост из-за ссылки, там занимательный подход к переводу - без параллельных мест, на качестве обратного перевода.

Date: 2017-12-11 05:50 pm (UTC)
From: [identity profile] thagastan.livejournal.com
Я вот не записал момент, когда люди не знающие языков совсем, начали свободно бегать по Лондону-Парижу, переводя все планшетом-смартфоном...
Кажется, что так было всегда, но недавно совсем.

Date: 2017-12-11 07:35 pm (UTC)
From: [identity profile] Алекс Шорн (from livejournal.com)
Только вот где тут во всем "превзошли человека"?

Такой ведь тезис выдвигался.
Edited Date: 2017-12-11 07:35 pm (UTC)

Date: 2017-12-12 01:29 am (UTC)
From: [identity profile] photo-viewer.livejournal.com
Да ладно - даже ИИ-фрики 80го уровня, вроде Курцвейля, про перевод так не считают - https://www.huffingtonpost.com/nataly-kelly/ray-kurzweil-on-translati_b_875745.html
(2029 год упоминается)

Date: 2017-12-12 09:54 am (UTC)
From: [identity profile] thagastan.livejournal.com
Те распознавалки-переводчики были первым поколением...

Date: 2017-12-11 05:23 pm (UTC)
From: [identity profile] pahmutova.livejournal.com
Так конечно, если бесплатные версии брать:)
Доступные за приличные деньги для корпоративного пользования переводческие программы техдокументацию берут отлично.
А худлит не нужен никому.

Date: 2017-12-11 05:48 pm (UTC)
From: [identity profile] thagastan.livejournal.com
худлит не нужен никому

Грустно как-то...

Date: 2017-12-11 07:37 pm (UTC)
From: [identity profile] Алекс Шорн (from livejournal.com)
К худлиту им бы пришлось к каждому писателю свою версию этой программы выпускать.
Она далеко не универсальна.

Техническую литературу, если ты знаешь специфику и термины в общем то проще в алгоритм перевода загнать. Там устойчивые выражения и простое построение фраз.

Я по программированию -если тема знакомая -не особо напрягаясь английские книги читаю. Хотя в общем то любитель в предмете.

А дай мне какого нибудь Диккинса - я на втором листе умру.
Edited Date: 2017-12-11 08:02 pm (UTC)

Date: 2017-12-11 07:32 pm (UTC)
From: [identity profile] Алекс Шорн (from livejournal.com)
Только вот к нейросетям эти программы не имеют никакого отношения.

Базу данных там периодически профессиональные переводчики правят. Под конкретные темы.
Поэтому они такие и узко заточенные.

Речь то шла о том что нейросети во всем превзошли человека.

Date: 2017-12-11 08:22 pm (UTC)
From: [identity profile] pahmutova.livejournal.com
Правят там не переводчики.
Переводчики вообще крайне редко участвуют в создании систем автоматического перевода.
Промышленная лингвистика очень своеобразно устроена.

Date: 2017-12-11 08:34 pm (UTC)
From: [identity profile] Алекс Шорн (from livejournal.com)
Ну и кто же там правит?
Люди ни слова не знающие по английски?

А тестирует перевод на адекватность кто - на этапе разработки, просто чел с улицы не знающий язык?

Date: 2017-12-11 08:51 pm (UTC)
From: [identity profile] pahmutova.livejournal.com
Есть переводчики за деньги, которые работают переводчиками -- в среднем плохо знают русский и средне какой-нибудь иностранный, чаще английский.
Есть лингвисты (русские), которые хорошо знают английский и не понимают, зачем вообще и кому нахрен сдался русский.
Вот они в среднем и занимаются разработкой систем автоматического перевода на русский язык.
У переводчиков и лингвистов принципиально разное образование и в среднем разная идеология.
Edited Date: 2017-12-11 08:52 pm (UTC)

Date: 2017-12-11 08:59 pm (UTC)
From: [identity profile] Алекс Шорн (from livejournal.com)
Про такие нюансы я не знал. Для меня они все переводчики как для обывателя.

Но в любом случае, я как то сомневаюсь, что такие гиганты как Гугл или яндекс - не могли бы перекупить технологию перевода на корню и прикрутить у себя. Для них это просто копейки.

У них монетизация не прямая - они могут позволить себе сервис с отличным качеством бесплатным держать.

Date: 2017-12-11 09:07 pm (UTC)
From: [identity profile] pahmutova.livejournal.com
Яндекс -- гигант. Спасибо, посмеялась.
Гигант, где зарплаты у сотрудников по 25 тыщ рублей.

Date: 2017-12-11 09:12 pm (UTC)
From: [identity profile] Алекс Шорн (from livejournal.com)
По капитализации гигант в России.

Но оставим один Гугл. Уж он то точно не карлик.

Date: 2017-12-11 11:03 pm (UTC)
From: [identity profile] vadim efimov (from livejournal.com)
Гигантов меряют не по зарплатам неясно кого, а по количеству и/или масштабу.

Да и в гиганте зарплаты будут пониже просто потому что народу много и классификация точнее. А еще есть работы которых нет нигде, из-за своего масштаба.

Впрочем, в интересующей меня области и зарплатах - 100+ людей там хватает, но я пока сторонюсь совсем гигантов, обитая в уютном тихом болотце.

Date: 2017-12-11 11:42 pm (UTC)
From: [identity profile] pahmutova.livejournal.com
Вот типичный пример: человек не знает русского языка, связно писать не умеет, работает в ИТ,

Date: 2017-12-12 12:10 am (UTC)
From: [identity profile] vadim efimov (from livejournal.com)
Типичный пример чего, не подскажете ли?
Впрочем, совершенно с вами согласен, с русским языком у меня так себе - со школы пошло. Пришлось найти область, в которой мои хромающие знания русского языка не доставляют мне неудобств. А с машинами у меня взаимопонимание гораздо лучше - тем и живу.

Date: 2017-12-12 10:39 am (UTC)
From: [identity profile] thagastan.livejournal.com
На начало года - треть Магнита...

Date: 2017-12-13 07:59 am (UTC)
From: [identity profile] pahmutova.livejournal.com
О том и речь.
В "Магните" мерчендайзеру с порога 30 дают.
А в Яндексе лингвисту с во -- 25.
Edited Date: 2017-12-13 07:59 am (UTC)

Date: 2017-12-13 09:44 am (UTC)
From: [identity profile] thagastan.livejournal.com
Именно...

Profile

thagastan

October 2025

S M T W T F S
    1234
56789 1011
12131415 161718
19202122232425
262728293031 

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Feb. 20th, 2026 11:03 pm
Powered by Dreamwidth Studios