Fox використовує машинне навчання Google при створенні фільмів

Fox використовує машинне навчання Google при створенні фільмів

Дослідники з кіностудії 20- Century Fox і Google Cloud розробили програмне забезпечення на основі машинного навчання, яке може аналізувати трейлери фільмів і прогнозувати, чи захочуть люди дивитися ці картини в кінотеатрах. Недавній дослідницький документ описує програму Merlin, яка здатна розпізнавати об'єкти і закономірності в трейлері для аналізу сцен фільму.


Технологія може відсканувати трейлери і виявити об'єкти на кшталт «людини з бородою», «пістолета», «автомобіля», а потім на основі контексту зробити висновок, чи є фільм бойовиком або драмою. «Трейлер з тривалим великим планом персонажа найімовірніше рекламує драму, - пишуть автори дослідження, - в той же час трейлер з швидкими і частими змінами кадрів більш вірогідний для бойовика».


Merlin використовує знання про загальні закономірності, щоб зрозуміти, як послідовність подій у трейлерах відбивається на очікуваннях глядачів з точки зору жанру. Технологія може розпізнати погоню на автомобілях і подальший вибух і відповідним чином позначити трейлер, підібравши заодно рекомендації з іншими фільмами, що включають подібні автомобільні погоні.

Merlin порівнює ці теги з великим набором даних, який включає сотні фільмів і мільйони записів про відвідування. Fox і Google стверджують, що інформація «повністю анонімна» і «не стосується вторгнення в приватне життя», хоча неясно, про які саме відомості йде мова і як вони збираються. Згідно з документом, що описує Merlin, система включає інформацію про відвідуваність, у тому числі «базові демографічні дані» на рівні окремих людей.

Каталогізація та оцінки Merlin на основі історичних уподобань кіноглядачів використовуються і для того, щоб передбачити, чи будуть люди купувати квитки на наступний великий літній блокбастер, в якому є «бородаті чоловіки, зброя та автомобілі». А починаючи з картини «Найбільший шоумен» 2017 року, 20th Century Fox використовує прогнози Merlin, щоб вирішити, які фільми запускати у виробництво і як краще їх просувати.

Проблема лише в тому, що мистецтво так не працює. Є багато факторів, які здатні зробити фільм успішним і які комп'ютер ідентифікувати не в змозі, навіть той, який може правильно розпізнати бороду. У фільмах є пантоміма, невловима акторська гра, тонкі жарти і важкі для кількісної оцінки нематеріальні сутності, які навіть реальним людям складно пояснити. Ось чому якісна критика фільмів вельми нетривіальна: є нескінченні варіанти аналізу «хороших» і «поганих» картин. Втім, можливо, сучасні блокбастери вже не є певною мірою мистецтвом, а виступають як атракціони, під час яких не потрібна робота розуму і серця?

Щоб зрозуміти обмеження Merlin, можна поглянути на аналіз фільму «Logan» 2017 року від режисера Джеймса Мангольда (James Mangold), який Google навела як приклад. Система проаналізувала трейлер і відзначила кожен розпізнаний об'єкт, наприклад: «машина», «автомобіль», «людина», «обличчя», і, найчастіше, «дерево».

Merlin вважає, що глядачі «Логана», швидше за все, ходили в кіно на «Чудову сімку», «Джейсона Борна», «Джона Уіка 2» і «Легенду про Тарзана». Легко зрозуміти, як теги «людина», «борода» і «пістолет» призводять до рекомендацій на кшталт «Чудової сімки» і «Джона Уїка 2», але, «Тарзан», ймовірно, обраний через велику кількість розпізнаних дерев. З п'яти найбільш популярних фільмів, які реальні глядачі дивилися до «Логана», Merlin вибрав правильно тільки один («Джон Уік 2») - «Джейсон Борн» і «Тарзан» не потрапили навіть у топ-20.


Сумнівно, що алгоритм Merlin вловив суть або навіть вигляд Х'ю Джекмана (Hugh Jackman), який грає старого Логана, якому все складніше жити в мінливому світі. Однак керівництво 20- Century Fox вважає, що викладкам Merlin варто довіряти тому, що система передбачила 11 з 20 фільмів, на які глядачі «Логана» раніше ходили в кіно. Вони навіть вважають ці відомості важливими при прийнятті рішень про рекламні бюджети та оптимальне просування картин.

Результати показують, що людям просто зрозуміти багато культурних речей, які машини поки не розпізнають. Звичайна людина, найімовірніше, назвала б серед найбільш цікавих аудиторії «Логана» супергеройські фільми на кшталт «Людей Ікс», «Доктора Стренджа» або «Бетмена проти Супермена». Merlin поки не розуміє культурний контекст, проте вельми точний вибір «Джона Уіка 2» говорить про те, що в майбутньому подібні технології можуть стати досить досконалими.

Незалежно від потенціалу, сумні думки навіює той факт, що кіностудії вже використовують інструменти на кшталт Merlin для удосконалення своєї діяльності: повторення успіху картин, які зірвали касу. «Історично кіностудії значною мірою покладалися на свій досвід при прийнятті рішень про інвестування в конкретний сценарій, але це може призводити до величезних ризиків, особливо при вкладеннях в нові оригінальні історії», - повідомляється в блозі Google.

Нескладно уявити майбутнє (тому що це вже багато в чому так), коли шаблонні фільми, що формують переваги масового глядача, будуть в свою чергу формувати і думку автоматичних алгоритмів, що роблять фільми ще більш шаблонними з метою мінімізації фінансових ризиків і додаткового розширення аудиторії. Коло замкнеться. Вже зараз кіноіндустрія прагне до постійних перезапусків, спроб створення «всесвітів» або нескінченної експлуатації вже створених - адже саме так Marvel і Disney заробляють мільярди. Спираючись на інструменти на кшталт Merlin, ми отримаємо галузь, в якій кожен автомобіль повинен потрапити в погоню, а потім перевернутися і вибухнути.

Image