Alibaba със силен ход в AI надпреварата

Кой ще изработи най-способният Large Language Model? Битката тепърва започва

Публикувано от Божидар Балевски май 09, 2024 в Изкуствен интелект

Снимка: Investclub

Alibaba Cloud обяви пускането на обновения си голям езиков модел (large language model). В четвъртък Alibaba Cloud представи усъвършенствания си модел Tongyi Qianwen, Qwen2.5, който демонстрира значителни подобрения в разсъжденията, разбирането на код и разбирането на текст в сравнение с предшественика си, Qwen2.0.

Според прегледа на OpenCompass, въпреки че актуализираният модел Qwen надминава GPT-4 на OpenAI по отношение на езиковите и творческите способности, той изостава в други области, като придобиване на знания, логическо мислене и математика.

Alibaba Cloud стартира оригиналния Tongyi Qianwen през април 2023 г., възползвайки се от глобалния интерес, предизвикан от дебюта на ChatGPT през ноември 2022 г. След първоначалния му успех през октомври беше представена усъвършенствана итерация, която се отличава с подобрени умения за обработка на сложни инструкции, генериране на съдържание, логическо извеждане и функции на паметта.

Джингрен Джоу, главен технологичен директор в Alibaba Cloud, изрази ентусиазъм от разнообразните и креативни приложения на моделите в сектори като потребителска електроника и игри. Той наблегна на потенциалните възможности за растеж, стимулирани от последните постижения в технологиите за генеративен ИИ.

Освен това Alibaba Cloud разкри, че над 2,2 млн. бизнес клиенти са използвали услуги с ИИ, задвижвани от Qwen, включително DingTalk, алтернативата на Alibaba на Slack. Компанията също така е предоставила нови модели на Qwen на общността с отворен код и е актуализирала своето Model Studio - платформата за ИИ на Alibaba - с нови инструменти за разработване на ИИ.

В по-широкия китайски технологичен пейзаж компании като Baidu и Tencent също представиха свои чатботове и модели на ИИ, отговаряйки на нарастващото търсене на генеративен ИИ. Baidu съобщи, че нейният бот Ernie е събрал над 200 милиона потребители, след като получи одобрение за публична употреба през август.

Бързото развитие на генеративния ИИ определя и развитието на хуманоидните роботи в Китай, които се очаква да изпълняват задачи в производството и други трудоемки отрасли.

Какво представляват LLMs (Large Language Models)?

Големите езикови модели (LLM), като Tongyi Qianwen на Alibaba, са сложни софтуерни системи, предназначени да разбират и генерират текст, подобен на човешкия, чрез обработка на огромни масиви от данни. Тези модели, обучени върху разнообразни текстове от интернет, книги и други източници, усвояват тънкостите на езиковите модели, което им позволява да отговарят на заявки, да генерират съдържание или да изпълняват задачи, които обикновено изискват човешки интелект. Тази способност позволява на LLM да захранват различни приложения - от автоматизиране на отговорите при обслужване на клиенти до подпомагане на творческото писане, което ги прави безценни инструменти в днешния свят, управляван от технологиите.

Надпреварата за изграждане на най-добрия Large Language Model

няколко големи технологични компании активно разработват и подобряват своите големи езикови модели (LLM). Ето кратък преглед на някои ключови играчи и техните неотдавнашни инициативи в тази област:

Google

LaMDA: Google работи върху своя собствена версия на разговорен изкуствен интелект, наречена LaMDA (Language Model for Dialogue Applications). Тя има за цел да направи разговорите с ИИ по-плавни и контекстуално осъзнати. Google продължава да усъвършенства LaMDA, за да се справя с по-нюансирани и сложни сценарии за диалог.
BERT и други модели: Google използва също така BERT (двупосочни кодиращи представяния от трансформатори) за разбиране на потребителските заявки в своята търсачка, което значително подобрява релевантността на резултатите от търсенето.

Meta (Facebook)

LLaMA (LLaMA - голям езиков модел Meta AI): Meta пусна своя собствена серия LLM под името LLaMA, които са предназначени за различни задачи, включващи разбиране и генериране на естествен език. Фокусът на Meta е върху създаването на модели, които могат да работят ефективно в различни мащаби, предлагайки потенциал както за широкомащабни, така и за по-ограничени приложения.
Изследвания и отворен източник: Meta участва в обширни изследвания за гарантиране на етичното използване на ИИ и подобряване на екологичната ефективност на обучението на големи модели. Те също така са допринесли за изследователската общност в областта на ИИ, като са предоставили отворен код на някои от своите модели и инструменти.

OpenAI

Серия GPT: OpenAI е известна със своите модели на генеративни предварително обучени трансформатори, като GPT-3 е един от най-известните примери. Тези модели са новаторски по отношение на способността си да генерират съгласуван и контекстуално релевантен текст въз основа на подсказки.
GPT-4 и след това: OpenAI продължава да разработва нови итерации, като слуховете и дискусиите около GPT-4 предполагат по-нататъшни подобрения в точността, качеството на резултатите и може би етични съображения за намаляване на злоупотребите.

Microsoft

Azure AI и интеграция с Bing: Microsoft е интегрирала LLM в своята търсачка Bing и други потребителски продукти. Те също така предоставят надеждни решения за изкуствен интелект чрез Azure AI, които предприятията могат да използват, за да внедрят функционалности на изкуствения интелект в своите операции.
Партньорство с OpenAI: Microsoft е стратегически партньор на OpenAI, като улеснява по-широкото внедряване на моделите на OpenAI чрез Azure и използва тази технология в собствените си продукти и услуги.

Baidu

ERNIE: ERNIE (Enhanced Representation through kNowledge Integration) на Baidu е значителна стъпка в развитието на китайския пазар на изкуствен интелект. ERNIE е предназначена за изпълнение на различни задачи за разбиране на езика и генериране на информация и е интегрирана в много от услугите на Baidu.

Тези разработки показват конкурентна, но съвместна среда в областта на изследванията и внедряването на ИИ, като всяка компания внася уникални предимства и акценти в своите инициативи за УРН.

Alibaba със силен ход в AI надпреварата

Кой ще изработи най-способният Large Language Model? Битката тепърва започва

Свързани публикации

Български пионер в изкуствения интелект получава $1 млн. от Amazon Web Services

Изкуствен интелект и космически технологии - Анализ на бизнеса на Armada

Anthropic ще се бори с доминацията на OpenAI в изкуствения интелект

The New York Times повдига дело за милиарди срещу Microsoft и OpenAI