Jak zastosować (i czy się da, w ogóle?) sztuczną „generatywną” inteligencję w AstroAkademii?
W Money.pl jest (z czerwca 2023)
artykuł „Sztuczna inteligencja w praktyce. Nudna, ale użyteczna?” Przedstawiono
tam zastosowanie, w którym AI/SI działa jako znawca pewnego
przedmiotu (tematu), w obrębie którego sensownie odpowiada na
możliwe pytania. W artykule tym przedmiotem jest system automatyki
przemysłowej, czyli zestaw maszyn-automatów, na którym żaden
człowiek się nie wyznaje, ale robi to (wyznaje się) sztuczna
inteligencja, tzn. odpowiednio wytrenowany („nakarmiony”) wariant
AI.
Pomysł polega na tym, żeby tym
przedmiotem, od którego ekspertem jest AI, zrobić AstroAkademię,
tzn. treść jej stron.
Tzn. żeby uzyskać dostęp do pewnej
AI i tak wytrenować pewną jej „końcówkę” (pewien jej
interfejs), żeby odpowiadała na pytania z zakresu AstroAkademii.
Sprawa jest istotna, ponieważ żaden
pojedynczy człowiek nie ogarnia AstroAkademii. Contenty
artykułów i dyskusji na forum liczą w sumie 35 096 982
znaki, co odpowiada ok. 22 tysiącom stron druku (po 1600 znaków na
stronie), lub 73 książkom-tomom po 300 stron każda. A jeszcze jest
treść zawarta w wykresach, kosmogramach i nagraniach wideo –
chociaż nie wiem, czy AI może czytać treści nie-tekstowe.
Jeśli masz pomysł, jak to zrobić,
napisz. Odpowiadając tutaj, lub emailem a1@wojciechjozwiak.pl.
Plaża po odpływie. Czerwiec 2023
Komentarze:
1.
2023-11-01 14:26:08.
JSC :
Porywasz się na gruby temat.
Przyjęło się brać się za to za pomocą LLM, ale dla amatorów jest to sprawa ekstremalnie trudna, a w językach niedominujących to już w ogóle. Jeśli chciałbyś iść od tej strony to trzeba by wziąć coś obsługującego pamięć i spróbować to zapętlić, żeby szedł po całej Akademii.
Z tego co znam (ale musisz wziąć poprawkę, że mało wiem) to najlepiej do tego nadaje się asystent AI octavia... https://octavia.one/. Warto w tym aspekcie zwrócić uwagę na projekt AI jaki prowadzą twórcy przeglądarki pod nazwą Leo... https://brave.com/leo-release/ ... przy założeniu, że może pracować na plikach lokalnych to można symulować pamięć i zmontować menedżera kierującego procesem obróbki zadanego serwisu WWW.
Nowsza metoda to opracowanie tzw. ontologii, czyli semantycznych schematów wiążących ze sobą poszczególne pojęcia odpowiadającymi im relacjami. I byłaby metoda, którą rekomendował, gdybyś na prawdę chciałbyś w to wejść. To jest sprawa, w której raczej nie ma bagażu teoretycznego zdolnego wykoleić koncepcyjnie kogoś, kto sam napisał CMS'a, a ładnie strukturalizowałaby (tu bym rekomendował bazę danych w stylu Ceramic... https://ceramic.network/composedb) wiedzę zawartą w zadanym zbiorze tekstów. Jako przykład wykorzystania takiej technologii warto zobaczyć witrynę w stylu wiki o nazwie golden... https://golden.com/
Żeby takowa baza danych stała się elementem pełnoprawnego asystenta AI trzeba zidentyfikować jakie mogą być zadawane do niej pytania i przetłumaczyć, któryś z języków ludzkich, w naszym wypadku polski i przekazać ich listę do jakiegoś chata, który by dopasowywałby pytania użytkownika, któregoś z tej listy.
2.
2023-11-01 22:35:41.
JSC :
Jeśli chodzi zas o content nietekstowy...
to w przypadku wykresów, kosmogramów itp. (filmy bez wydatnej pomocy ekspertów zajmujących się tajnikami tych technologii to temat raczej stracony) sądzę, że nie są do końca zapisywane jako bez tekstowe. Edytory muszą mieć dostęp do struktury danych, na których obrabiają. I to daje jakoś szansę na przyłapanie jakiś plików z zapisem w formie XML i wtedy powinno się dać zrobić interfejs dla LMM, który wydobywałby dane stamtąd i przekształcał je na tekst w języku ludzkim, którym AI mogłaby śmiało operować.
Jeśli nie da się bezpośrednią tą metodą to można wykorzystać fakt, że zapewne te edytory tworzą grafikę wektorową, a ta powinna się dać sprowadzić do formatu svg. I wtedy wydobycie informacji domenowych z takich surowych danych jest zadaniem ambitnym, ale do wykonania bez nadmiernego wysiłku.
Najgorszy przypadek to grafika rastrowa, która faktycznie treścią nietekstową, którą przy znanych nam narzędziach jest nie doruszenia. Tu moje dywagacje sięgają do tematu tego co jest potrzebne, żeby temat był wykonalny:
- LMM zdolny ruszyć ten temat musi mieć jakąś bezpośrednią wtykę do API w jakimś edytorze graficznym... zdaje się, że ChatGPT 4 może coś takiego mieć, ale trzeba to zweryfikować
- zabawa w programowanie no code skryptu wydobywającego astrodane z zbioru pixeli zalatuje niezłym kawałem harówy
Dać przejście z cyfrowego na analogowy wpisywane ręcznie, wystarczy sobie odpalić dowolny i najprostszy program muzyczny żeby zobaczyć jak to funkcjonuje.
4.
2023-11-02 13:06:06.
JSC :
@Adam Pietras
Możesz szerzej omówić to co napisałeś? Zdaje się, że dokonałeś ostrego skróta myślowego...
5.
2023-11-02 16:54:32.
Adam Pietras :
- JSC - cyfra, analog, język
Witam serdecznie, tu się rozchodzi po części o wątki obecne w mojej prywatnej korespondencji z P. Wojciechem. Tam padł temat sztucznych sieci neuronowych, o których mam jakieś pojęcie choćby na zasadzie moich zainteresowań kognitywistyką i neurobiologią. Natomiast najnowsze SI buduje się na sieciach neuronowych. //////// W kwestii analogowości, tj. danych nie-tekstowych, mamy programy rozpoznające mimikę twarzy, barwy, formy (SI robi jakieś tam powiedzmy obrazki artystyczne i muzykę). Dlatego piszę o programach muzycznych, bo tam informacja jest przekazywana na zasadzie krzywej, funkcji trygonometrycznej. Kręci się pokrętłem (analog), zegar pokazuje funkcję (linia łamana, fala, częstotliwość tego czy tamtego), a SI robi z tego brzmienie, ton, długość, mnóstwo innych rzeczy. ///////// Trudno mi od czegoś konkretnego zacząć, bo temat jest bardzo szeroki, natomiast z doświadczenia widzę, że jeśli ogarnąć trochę szerzej czym jest taka dziedzina matematyki jak logika, to programowanie wchodzi w dużej mierze intuicyjnie. W tym momencie mamy kilka prostych ciągów logicznych i to polega na tym, żeby umiejscowić to w języku. Ja poza podstawy na tą chwilę nie ogarniam, natomiast myślę, że to nie jest rzecz dla mnie niemożliwa. Pozdrawiam serdecznie.