Какво са ChatGPT и GPT-3 и каква е разликата?

ChatGPT доби изключителна популярност в края на 2022 г. и все още е обект на разгорещени дискусии. По-опитните и предприемчиви мигновено съзряха възможности за монетизиране чрез него, а по-консервативните се фокусираха върху евентуалните му негативи.

В публикацията ще дадем отговор – какво е ChatGPT, какво е GPT-3, каква е разликата между тях и какви са алтернативите им, за да се ориентирате как можете да ги използвате правилно и да Ви бъдат от полза.

Какво е ChatGPT?

ChatGPT е чатбот, базиран на езиковия модел GPT-3,5. Той е създаден от OpenAI и бе официално лансиран на 30 ноември 2022 г. Взаимодействието с ChatGPT е под формата на диалог – като в чат приложение с някой приятел, но в случая срещу Вас стои бот с изкуствен интелект.

В рамките на една чат сесия – ChatGPT може да отговаря на поредица от въпроси. Така, след като Вие зададете въпрос и получите отговор, можете да зададете последващ въпрос по темата и да се инициира дискусия.

С ChatGPT можете да водите множество паралелни дискусии по различни теми. Например – една за музика, друга за живопис, трета за телефони т.н.

За да се предотвратят потенциални злоупотреби, въпросите към ChatGPT се филтрират през API за модериране на OpenAI най-вече по отношение на расистки или сексистки теми.

ChatGPT надгражда предхождащия го InstructGPT и дава по-прецизни отговори. Може да признава за свои грешки, да оспорва Ваши неправилни предположения и да отхвърля неподходящи въпроси или искания.

Какво е GPT-3?

GPT-3 е езиков модел, абревиатура от Generative Pre-trained Transformer 3. Той също е продукт на OpenAI, представен през май 2020 г. и реализиран в тестова версия през юни 2020 г. Въз основа на подадени думи или теми, езиковият модел може да генерира текст, както би го направил човек.

Може да изпълнява и много други езикови задачи, сред които превод на текст, обобщаване на дълги текстове, отговаряне на въпроси и др. Не може създава видео, аудио или изображения като Dall-E 2.

Моделът е обучаван с текстови бази данни от интернет – книги, уеб текстове, Wikipedia, статии и др. в размер на 570 GB или 300 милиарда думи с актуалност до 2021 г. включително. Тяхната относителна тежест в обучението е представена по-долу:

Източник na данниБрой токениДял в обучението
Common Crawl410 милиарда60%
WebText219 милиарда22%
Книги 112 милиарда8%
Книги 255 милиарда8%
Уикипедия3 милиарда3%

Като езиков модел, GPT-3 е базиран на вероятността – обучава се да може да отгатне каква трябва да бъде следващата дума в изречението. Обученията се провеждат в сътрудничество с Microsoft на инфраструктурата Azure.

В рамките на обучението преминава и през етап на контролирано тестване. На входа се подават данни, например „Какъв е цветът на вишневия плод?“. Ако езиковият модел сгреши, екипът, който го тренира, въвежда верния отговор и така го обучава на правилните отговори.

На следващ етап от обучението на модела – при зададен въпрос се предлагат множество отговори, които моделът е давал в отговор на въпроса по-рано, но класирани от екипа от най-добрия към най-лошия, за да обучават модела на сравнения.

Това, което отличава тази технология, е, че продължава да се учи, докато предвижда каква трябва да бъде следващата дума и непрекъснато подобрява способността си да разбира задачите, които се поставят.

Каква е разликата между ChatGPT и GPT-3?

ChatGPT е вариант на езиковия модел GPT-3. И двата са разработени от OpenAI и са базирани на архитектурата на Transformer, от където идва буквата „T“ в абревиатурите им. Първо е създаден големия езиков модел GPT-3 (през юни 2020 г.) и след това на негова база е изведен ChatGPT (през ноември 2022 г.) със специфичната функция за водене на диалог в чат.

И двата инструмента си приличат по това, че използват големи количества данни и мощни изчислителни ресурси, за да изучат структурата на езика и да могат да генерират смислен и логически свързан текст.

Основната разлика между тях е, че протоколът GPT-3 е много по-голям от ChatGPT. GPT-3 разполага със 175 милиарда параметъра, което го прави един от най-големите и най-мощните модели за обработка на езици с изкуствен интелект до момента.

За разлика от него, ChatGPT разполага само с 20 милиарда параметъра, тъй като е с по-тясна специализация – да генерира текст в диалог. За тази цел той е обучен със специфични набори от данни и има по-малко параметри.

Другата голяма разлика между между ChatGPT и GPT-3 е достъпността. ChatGPT е много по-достъпен и лесен за използване, поради което и има толкова голяма популярност. За разлика от него GPT-3 е много по-мощен, но по-трудно достъен, и остава в сянка.

В заключение, ChatGPT е версия на GPT-3, оптимизирана за чат, поради което е и доста по-забавен. А това, че е достъпен и безплатен, го прави още по-желан.

За какво да използвате ChatGPT?

Ако желаете ChatGPT да създаде текст за Вас, имайте предвид, че GPT-3 моделът е актуален към 2021 г., тъй като е обучаван върху информацията до тази година. За актуална информация към 2023 г. не разчитайте на този езиков модел.

Имайте предвид, че GPT-n моделите използват за източник бази данни, с които са обучавани и не правят търсене в интернет, за да да извеждат отговори, както правят съвременните търсачки.

ChatGPT може да създаде текст с недостоверна информация, да дава грешни отговори или да не разбира какво се опитвате да го попитате. Ако възложите твърде сложна задача с много параметри, ChatGPT може да игнорира част от тях.

По-уместно, безопасно и успешно можете да използвате езиковия модел за перефразиране на вече създаден текст, за обобщаване на текст, сравнения и др. като вие въвеждате данни на входа, за да поставите коректно задачата.

Полезна страница с промптове, идеи и туулове за ChatGPT (поддържа се от Аделина Драндева)

Още идеи, споделени от Калоян Димитров в групата SEO Практика:

С добър prompt може да го накарате да прави много неща. Доброто генериране на промптове може да стане част от job description-a след някоя и друга година.

Най ми харесва да го накараш самия chatGPT да ти прави prompts – един вид, да го накараш той да ти свърши част от твоята работа – то това и му е целта – да е асистент.

Или пък – act as [job title/software/etc.].

За какво работи супер и вече съм го ползвал:

  1. Да направи от ключови думи въпроси – тук почти никаква намеса не е необходима после; или да ги направи на заглавия за блог постове – вече ще си добавите допълнителни думи, ако са ви нужни (или ще му кажете да ги сложи);
  2. Да обобщава текст (като meta descriptions, или друг тип описания).
  3. Да пише код (схема, JSON, regex – за конзолата е супер), екселски и sheets формули и т.н.
  4. Структура на статия от гореспоменатите вече заглавия – малко е repetitive – трябва да се поиграе с prompt-а за да излезе от рамката – what is, how to, examples, conclusion.
  5. Кратки отговори на въпроси (FAQ, short blog posts, help centre, и т.н.)
  6. Почти се справя в сортирането на ключови думи по intent и т.н. но пък няма много input и не може ти да ми пейстнеш 500+ думи (имаше ограничение някакво). Ако не ви изкарва целия input, пишете continue, за да си довърши мисълта.

Lifestyle stuff:

  • Рецепти, хранителни режими, списък с покупки и сортиране :Д може и по калории и хранителни ограничения да му зададете и изчиствате, докато сте готови;
  • Предложения за филми базирано на интереси;
  • Решаване на задачи за даскало – образованието тотално ще се промени и трябва да навакса;

Ресурси:

Стратегия за бърза монетизация с GPT-3

Във Facebook групата – SEO практика – успешния афилиейтър George G. сподели стратегия за бърза монетизация с GPT-3. Ето какво сподели той:


GTP3 е златна мина и сега е момента да се включите здраво в афилейт бизнеса на US пазара, дори и да не знаете английски.

Ето ви един цялостен план за това как да правите пари в момента и то сравнително бързо и с много малка времева и капиталова инвестиция.

  1. Откривате си ниша и и правите много детайлен кииуърд мапинг, вадите всички важни ключови думи от нишата и си ги слагате в ексел и си ги групирате по статии, които трябва да се направя. Този план трябва да е максимално детайлен и да покрива максимално добре нишата.
    • Тул, който може да ви помогне: WriterZen, Ahrefs, Semrush
  2. По всяка от ключовите думи с най-голям сърч волюм за всяка статия правите детайлен аутлайн като включвате всички хединги и информация по параграфи, която имат конкурентите и правите с копи пейст една наистина детайлна статия, кото покрива темата във всичките и детайли
    • Тулове, които да ви помогнат: Frase
  3. Правите анализ на важните ключови думи, които ползват конкурентите за ключовата дума от т.2
    • Тулове които могат да го свършат: Frase, NeuronWriter, MarketMuse, SurferSeo
  4. Давате цялата статия на GPT3 и му казвате да я перефразира, като включи в статията и думите от т.3
    • Тулове които да ползвате: Openai GPT3
  5. Качвате си съдържанието на домейн и го налинквате вътрешно максимално, като ползвате вариации на ключовите думи за всяка статия, минимум по 5-6 вътрешни линка в статия, като се фокусирате на мъни статиите
    • a.) За AI секптици, които мислят, че Гугъл след време ще им надуши контента, че е перефразиран с АI, минавате през тул като Instatext или WordTune, за да смените някоя дума стилистично тук там.
  6. Почвате як линк билдинг
  7. Profit

PS. Ако не правите разлика межде chatgpt и gpt3 и между писане и перефразиране, този пост не е за вас.


Дискусията към поста можете да проследите тук.

Какво е OpenAI и кой стои зад организацията?

OpenAI е изследователска лаборатория за изкуствен интелект (AI), която включва корпорация с нестопанска цел OpenAI LP и компанията майка OpenAI Inc. Създадена е в Сан Франциско в края на 2015 г. от Сам Алтман , Илон Мъск и др. с вложение в размер на 1 милиард щатски долара. Мъск се оттегля от борда през февруари 2018 г., но остава донор.

През 2019 г. OpenAI LP получава инвестиция в размер на 1 милиард щатски долара от Microsoft и Matthew Brown Companies. Microsoft се включват в обученията на езиковия модел, като предоставят и своята инфраструктура Azure, а на 22 септември 2020 г. получават лиценз за ексклузивно използване и модифициране на основния модел GPT-3. За света е достъпен публичния API.

Microsoft имплементират ChatGPT в Bing през март 2023 г.

През март 2023 г. в търсачката на Microsoft – Bing предстои да стартира нова чат функционалност, базирана на ChatGPT. Според Microsoft – при диалог с потебителя под формата на чат, може по-точно и ясно да бъде разбрано какво пита, от какво се интересува (какъв е user intent-ът). Предвижда се отговорът да бъде изведен директно, без да се предлагат резултати от нета с линкове.

От Microsoft вярват, че с имплементацията на ChatGPT ще получат конкурентно предимство пред Google и ще имат възвращаемост на направената в GPT-3 инвестиция.

Други алтернативни AI езикови модели

GPT-3 е сред достъпните и популярни езикови модели, но не и единствен. LaMDA на Google е негова алтернатива. Има модели и на Microsoft, Amazon и на Станфордския университет. Те обаче не са толкова популярни, тъй като не са толкова достъпни.

OpenAI осигуриха достъп до GPT-3 по време на процеса на тестване, докато LaMDA на Google е достъпна за избрани групи в ограничен капацитет за тестване.

През февруари 2020 г. Microsoft представиха Turing Natural Language Generation (T-NLG) – един от най-големите езикови модели със 17 милиарда параметъра и изключителни резултати за обобщаване на текстове и отговаряне на въпроси .

Източник: Microsoft

На изображението по-горе виждате сравнение на езикови модели на база броя параметри, които използват.

Воден знак за маркиране на AI генерирано съдържание

Все по-широкото използване на AI за генериране на съдържание бе повод създателите на GPT-n моделите – OpenAI да предвидят мерки за безопасност, като грижа за хората. Идеята е езиковият модел да не се използва срещу човечеството.

За тази цел през юни 2022 г. наемат Скот Арънсън и като първа мярка е предвидено добавянето на криптографски „воден знак“ в генеирания с AI текст. Водният знак ще бъде невидим за обикновения читател и ще може да се дешифрира само със специален ключ.

За да се елиминира водния знак и да не бъде разпознавано, че текстът е писан с AI, е достатъчно да прерифразирате текста, генериран от AI, преди да го използвате по предназначение.

Какво да очакваме от GPT-4 и кога?

GPT-4 се очаква да бъде реализиран в началото на 2023 г. Той е значително по-голям и по-мощен от GPT-3. GPT-4 използва 170 трилиона параметъра, докато GPT-3 само 175 милиарда параметъра. Благодарение на по-големия брой параметри – GPT-4 ще може да обработва и генерира текст с по-голяма точност и плавност.

Но GPT-4 ще може да се използва и за други задачи, които не са еикови – като генериране на изображения и видео, тъй като архитектурата Transformer, на която е базиран, се използва, както за обработка на естествен език (NLP), така и за компютърното зрение (CV).

Ето няколко примера за какво ще може да се използва GPT-4:

  • Езиков превод: Способността на GPT-4 да разбира и генерира текст на естествен език го прави приложим и за машинен превод. Може да се обучава върху голям набор от данни от преведени текстове, за да се подобри неговата точност и плавност.
  • Обобщаване на текст: Способността на GPT-4 да генерира човешки текст може да бъде използвана за обобщаване на текст, така, че изходният текст трябва да бъде лесен за разбиране и четене.
  • Отговаряне на въпроси: GPT-4 може да отговаря на въпроси и да предоставя подробни обяснения, които могат да бъдат полезни за приложения като обслужване на клиенти или техническа поддръжка.
  • Генериране на изображения и видео: GPT-4 е изграден върху архитектурата Transformer, която е доказано ефективна за различни задачи за машинно обучение, включително компютърно зрение. Това означава, че GPT-4 потенциално може да се използва за задачи като генериране на изображения и видео.
  • Други приложения: Гъвкавостта и адаптивността на GPT-4 го правят обещаващ инструмент за широк спектър от задачи за обработка на естествен език. Може да се използва в области като чатботове, автоматизирано писане на новини и дори творческо писане.

Следва продължение…