Всемирная организация интеллектуальной собственности (ВОИС) выпустила отчет о патентном ландшафте в генеративном ИИ 2024
Tencent, Ping An Insurance Group и Baidu владеют наибольшим количеством патентов GenAI. С 2017 года Китай ежегодно публикует больше патентов в этой области, чем все остальные страны вместе взятые. VAE и LLM являются второй и третьей по величине моделями с точки зрения патентов, с примерно 1800 и 1300 новыми патентными семействами соответственно в период с 2014 по 2023 год. Это лишь основные краткие выдержки отчета. Под катом о том, что еще интересного можно из него подчерпнуть.
Отчет состоит из 6 глав и начинается с основных концепциий генеративного ИИ от истории до наших дней в поисках предпосылок того, почему генеративный ИИ стал именно таким, каким стал
В качестве примера график влияния Chat GPT на количество созданных репозиториев
Основные выводы:
Среди наиболее важных моделей GenAI:
1. генеративно-состязательные сети (GAN)
2. вариационные автоэнкодеры (VAE)
3. Большие языковые модели на основе декодера (LLM)
Однако не все патенты GenAI можно отнести к этим трём конкретным основным моделям на основе имеющейся информации из патентных рефератов, заявок или названий.
Среди этих моделей GenAI большинство патентов принадлежат GAN. В период с 2014 по 2023 год было 9700 патентных семейств этого типа моделей, из которых 2400 патентных семейств были опубликованы только в 2023 году. VAE и LLM являются второй и третьей по величине моделями с точки зрения патентов, с примерно 1800 и 1300 новыми патентными семействами соответственно в период с 2014 по 2023 год.
С точки зрения роста патентов, патенты GAN показывают самый сильный рост за последнее десятилетие. Однако в последнее время этот рост замедлился. Напротив, диффузионные модели и LLM показывают гораздо более высокие темпы роста за последние три года, при этом количество патентных семейств для диффузионных моделей увеличилось с 18 в 2020 году до 441 в 2023 году, а для LLM — с 53 в 2020 году до 881 в 2023 году. Бум GenAI, вызванный современными чат-ботами, такими как ChatGPT, явно увеличил исследовательский интерес к LLM.
Распределение моделей на Hugging face по модальности
Глава 2 посвящена патентам и исследованиям в генеративном ИИ, описывает глобальное развитие, ведущих владельцев патентов, основные юрисдикции подачи заявок.
Основные выводы:
Среди различных режимов GenAI или типов ввода и вывода данных большинство патентов относятся к категории изображений/видео. Данные изображений/видео особенно важны для GAN. Патенты, связанные с обработкой текста и речи/звука/музыки, являются ключевыми типами данных для LLM. Остальные режимы: модели 3D-изображений, химические молекулы/гены/белки и код/программное обеспечение, имеют гораздо меньше патентов на данный момент. Как и в случае с патентами, связанными с основными моделями GenAI, некоторые патенты не могут быть четко отнесены к определенному типу данных. Кроме того, некоторые патенты отнесены более чем к одному режиму, поскольку определенные модели GenAI, такие как многомодальные большие языковые модели (MLLM), преодолевают ограничение использования только одного типа ввода или вывода данных.
Китайская академия наук явно лидирует по количеству научных публикаций, опубликовав более 1100 публикаций с 2010 года. Университет Цинхуа и Стэнфордский университет следуют на втором и третьем местах, опубликовав более 600 публикаций каждый. Alphabet/Google (четвертое место) — единственная компания в двадцатке лучших (556 научных публикаций).
Доминирование китайцев в патентах
Однако при измерении влияния научных публикаций по количеству цитирований компании доминируют. Alphabet/Google является лидирующим учреждением с большим отрывом, а еще семь компаний присутствуют в первой двадцатке. Случай OpenAI также заслуживает внимания. В нашем корпусе научных публикаций GenAI компания опубликовала всего 48 статей (325-е учреждение по количеству публикаций), но эти публикации получили в общей сложности 11 816 цитирований из других научных публикаций (13-е место в целом).
Глава 3 описывает патентные тенденции в моделях генеративного ИИ
Основные выводы: с точки зрения роста патентов, семейства патентов, назначенные GAN, показывают самый сильный рост за последнее десятилетие. Однако рост патентов семейств патентов GAN замедлился, а семейства патентов GAN увеличились лишь умеренно за последние три года. Аналогичное замедление роста патентов можно увидеть для семейств патентов для моделей VAE и авторегрессионных моделей. Напротив, диффузионные модели и LLM показывают гораздо более высокие темпы роста за последние три года: количество семейств патентов для диффузионных моделей увеличилось с 18 в 2020 году до 441 в 2023 году, а для LLM — с 53 в 2020 году до 881 в 2023 году. Бум GenAI, вызванный современными чат-ботами, такими как ChatGPT, явно увеличил исследовательский интерес к LLM.
Средний прирост гоодовых патентов в различных моделях ИИ
На уровне страны Китай доминирует во всех пяти моделях GenAI с точки зрения патентных семейств. Лидерство Китая особенно заметно в диффузионных моделях, где Китай опубликовал в 14 раз больше патентных семейств с 2014 года, чем второе по величине местоположение изобретателей, США (500 патентных семейств по сравнению с 35 патентными семействами). Китай также имеет очень высокую глобальную долю патентов в области авторегрессионных моделей
США особенно сильны в VAE и LLM. Значительная часть патентов GenAI из Республики Корея попадает в категорию моделей GAN. Для Японии примечательно, что подавляющее большинство патентных семейств GenAI не могут быть связаны ни с одной из пяти основных моделей GenAI.
В Индии патентные семейства GAN составили относительно высокую долю от общего числа патентов GenAI. В Великобритании многие патентные семейства относятся к категориям GAN и VAE. Германия имеет относительно сильное исследовательское присутствие в моделях GAN и VAE.
Глава 4 посвящена модальностям генеративного ИИ.
Основные выводы: с точки зрения роста патентных семейств, за последнее десятилетие больше всего выросли патентные семейства GenAI, основанные на изображениях/видео и молекулах/генах/белках (средний годовой темп роста около 45% в период с 2014 по 2023 год). Патентные семейства GenAI, основанные на молекулах/генах/белках, также были лидерами роста в последние годы. Напротив, общее количество патентных семейств GenAI, основанных на речевых/звуковых/музыкальных данных, увеличилось лишь незначительно с 2021 года.
Средний прирост годовых патентов в разных модальностях
Если рассмотреть 20 ведущих исследовательских организаций с точки зрения патентных семейств GenAI, то можно увидеть, что основные исследовательские организации сосредоточены на деятельности GenAI, связанной с обработкой данных изображений и видео.
Tencent Holdings является мировым лидером по количеству опубликованных патентных семейств в режимах GenAI. Китайская компания социальных сетей/игр в основном занимается исследованиями GenAI, которые обрабатывают типы данных изображения/видео, текст, речь/голос/музыку, а также другие режимы. Китайские компании Ping An Insurance и Baidu идут следом за Tencent по количеству патентных семейств и имеют схожую схему исследований, фокусируясь на тех же модальностях.
Связь между моделями и модальностями
Глава 5 рассматривает патентные тенденции в приложениях генеративного ИИ. В этой главе определены 21 область применения в патентном ландшафте GenAI и исследуются различные тенденции в этих областях.
Основные выводы:Самая большая область применения — категория программного обеспечения. Однако следует отметить, что большое количество патентных семейств не может быть отнесено к конкретному приложению и вместо этого включено в категорию программного обеспечения/других приложений.
Распределение патентов по областям применения
Патентные семейства в других категориях меньше по количеству, на втором месте находятся науки о жизни (5346 патентных семейств в период с 2014 по 2023 год), а на третьем месте — управление документами и издательское дело (4976) (рисунок 26). Другие заметные приложения с патентными семействами GenAI, количество которых за тот же период составило от 2000 до 5000, — это бизнес-решения, промышленность и производство, транспорт, безопасность и телекоммуникации.
Наибольший рост наблюдался в области патентов на использование GenAI в управлении энергоресурсами как с 2018 года, так и за последние три года. При этом за последние три года также наблюдался рост числа патентов на использование GenAI в сельском хозяйстве.
Глава 6 про опасения по поводу растущего использования моделей и инструментов GenAI, начиная от нарушения авторских прав и потенциального нецелевого использования и заканчивая риском сокращения рабочих мест.
Здесь лишь краткие выводы, поэтому рекомендую отчет к самостоятельному прочтению и изучению. Ссылка
P.S. Все права разрешены ВОИС. Копирование и распространение отчета приветствуется, чем я и воспользовалась.
P.P. S. Если вам интересны новости про генеративный ИИ, LLM, мультиагентов, я рассказываю об этом в своем Телеграм канале https://t.me/generative_ai_ru
Источник: habr.com