ዝርዝር ሁኔታ:

ስርዓት ዴ Conversație Bazat Pe Inteligență Artificială: 6 ደረጃዎች
ስርዓት ዴ Conversație Bazat Pe Inteligență Artificială: 6 ደረጃዎች

ቪዲዮ: ስርዓት ዴ Conversație Bazat Pe Inteligență Artificială: 6 ደረጃዎች

ቪዲዮ: ስርዓት ዴ Conversație Bazat Pe Inteligență Artificială: 6 ደረጃዎች
ቪዲዮ: AI Ethics and Democracy: Debating Algorithm-Mediated Direct Democracy and the Democratization of AI 2024, ህዳር
Anonim
ስርዓት ደ Conversație Bazat Pe Inteligență Artificială
ስርዓት ደ Conversație Bazat Pe Inteligență Artificială

Autor: Stanut Nicolae-Radu

ግሩፓ - 333AB

ማሳሰቢያ: 8

ደረጃ 1: ገላጭ Funcțională

ገላጭ Funcțională
ገላጭ Funcțională

Princin principiu sistemul va fi asemănător

የ Google ረዳት Amazoni የአማዞን አሌክሳ ፣ ili a pot da da com cale cale cale cale cale cale rat,,,,,,,,, face face face face face Creierul acestui dispozitiv va fi un Raspberry pi 3, datorită faptului că dispune de Wi-Fi, acest lucru permițând conectarea la serviciul cloud Amazon, care va da „inteligență” sistemului.

Folosind serviciul de cloud și inteligență artificială de la Amazon, acest dispozitiv va avea o funcționalitate practic identică cu የአማዞን አሌክሳ. በምሳሌነት የሚጠቀስ ምናባዊ ፖታ prezenta starea meteo, poate ține minte notițe, poate pune alarme, dar din păcate (sau fericire?), Aceste lucruri depind în totalitate de Amazon, iar comenzile dispozitivului se dau în limba engleză.

Ca obii obiectiv secundar, voi încerca să integrez limba română astfel încât asistentul să poată țnțelege și comenzi și de la persoane necunoscătoare de limba engleză. Alt obiectiv secundar ar fi ca asistentul să ajute la automatizarea unor procese, de exemplu aprinderea și stingerea unor lumini, oprirea unei ሽልማት። ደሴጉር ፣ ኤፒአይ-አል አማዞን ቫ permite aceste lucruri።

Sursa poză: https://consequenceofsound.net/2018/03/ አማዞን-alexa-devices-are-creepily-laughing-at-the--ባለቤቶች-for-no-reason/

ደረጃ 2 - አካል

የፔንቱራ ሪልዛዛሪያ ፕሮፔክትሉይ ነኝ።

  1. Raspberry PI 3 B+

    አነስተኛው የኮምፒተር እሴት ክሬይሉል ፕሮፔክትሉይ ፣ የሊኑክስ ዴቢያን የርዕሰ አንቀፅ አርኤምኤስ። እንደ አሴሜኒያ ፣ የአርአያነት ሞዴል አሰራጭ dei de wi-fi ፣ conexiunea la internet fiind absolut necesară pentru motoarele de text-în-vorbire și vorbire-în-text።

  2. PS የዓይን ካሜራ

    ፖስት ማይክሮፎን ("urechea proiectului") am ales o cameră destinată consolei Play Station 3 deoarece dispune de un microfon puternic cu 4 canale, fiind mai ieftină decât o cameră web obișnuită

  3. Boxă portabilă

    የፔንቱሩ መረጃ በፎፎ ነቪዬ ዴ ኤን difuzor ፣ am folosit o boxă cu fir primită de la un prieten

  4. 2 እሳት + LED
  5. Caserolă

    ካርካሳ proiectului ፣ o caserolă de sarmale: ዲ

ደረጃ 3 ሃርድዌር

ሃርድዌር
ሃርድዌር

እኔ በአዱናት ክፍል ውስጥ ፣ እኔ በትራክ ላአአአአአአአአአ አአአአአአ አገባዋለሁ ፣ በእቅዱ ቀላልነት። Boxa portabilă se conectează la portul USB pentru alimentare lai la portul jack pentru playback, camera/microfonul se conectează doar la portul USB prin care comunică cu computer-ul. እኔ በአዲሱ መርሃ ግብር ውስጥ መሪነት-ul conectat la pin-ul 17 cu rezistorul, pentru comanda de lumină. ኒሚክ ውስብስብ።

ደረጃ 4: ሶፍትዌር

Arhitectura acestui proiect presupune un "creier" care să preia comenzi de la utilizator (voce), să transforme datele într-un format accesibil lui (ጽሑፍ) ăi să le redea răspunsul sau confirmarea unei acțiuni înapoi (voce). Pentru acestea a fost nevoie de 3 servicii ይለያል

  1. የሞተር ንግግር-ወደ-ጽሑፍ (STT) ፣ ከቅድመ-ቀነ-ገደብ (ኢንፎርሜሽን]
  2. በስርዓተ -ጥበባት ውስጥ ሰው ሰራሽ ፣ እስከ አሁን ድረስ በዚህ ጉዳይ ላይ ችግር ፈጥሯል።
  3. የሞተር ጽሑፍ-ወደ-ንግግር (ቲ ቲ ኤስ) ፣ በሌላ ጊዜ ደግሞ በአገልግሎት አሰጣጥ ላይ አረጋግጠዋል።

Pentru STT am folosit API-ul de la Google ፣ የ Google ንግግር ኤፒአይ ፣ የእንክብካቤ ዋጋን ፣ እንደዚሁም ማሪ አንድ ኮንቬንሽን și o rată mică de erori ፣ dar oferă uni un număr limitat de apeluri። Am ales acest API datorită faptului că această parte a sistemului este cea mai sensibilă la erori și cea mai supusă la perturbații. Datorită limitărilor hardware impuse de computer (putere de procesare, spațiu de stocare, memorie) ፣ folosirea unui serviciu ከመስመር ውጭ ዋጋ ብቻ ፣ እንደ እኔ ያለ ሁኔታ በአገልግሎቱ ደመና ፣ በአስተያየቱ መጀመሪያ ላይ ማሪ ማሬ ፣ ዳሬ un un tim Google având unul dintre cele mai bune motoare STT.

የፔንቱሩ ግብረመልስ-ተጠቃሚው ተጠቃሚ (ቲ ቲ ኤስ-ኡል) ከመስመር ውጭ ፣ ሞባይል ከመስመር ውጭ ፣ አንድ ሰው ለሚያስጨንቀው ዋና ተጠቃሚው እንደገና ለመገምገም ni nici nu este la fel de sensibil precum STT-ul. Sintetizarea vocii este făcuta de ፌስቲቫል የንግግር ውህደት ስርዓት ፣ care este oferit gratuit sub o liceță de tipul MIT። ለሮቦቲክ ፣ ለባለ ብዙ ማቲ ኢንጂነሪቢል ፋță ዴ ኢስፔክ ፣ አልት ሞተር TTS ከመስመር ውጭ። Avantajul său față de serviciile online este că nu are niciun fel de limitare la numărul de coversii.

Liantul dintre STT și TTS ፣ precum și partea “iteligentă” este platforma denumită ጃስፐር። የመሣሪያ ስርዓትă ክፍት ምንጭ ፣ GitHub la link-ul: https://github.com/jasperproject/jasper-client. Aceasta face legătura dintre toate serviciile descrise mai sus și ia decizii în funcție de input-ul utilizatorului. Este compatibilă cu Raspberry PI ፣ fiind scrisă în Python። Am ales această soluție în detrimentul celor Cloud datorită modularității ፣ platforma permite folosirea oricărui serviciu STT și TTS ፣ dar și definirea oricărei acțiuni folosind limbajul de programare Python.

በስርዓተ -ትምህርቱ ሰው ሠራሽ አሠራር እጅግ በጣም ጥሩ የአሠራር ሂደት ፣ በአስተያየቱ ውስጥ በጣም ጥሩው የማሻሻያ ማሽን የመማር (ቻትቦት) ዲ ኤን ኤ ኤን ካራቴተር ኃላፊ ያልሆነ ሰው ነው። Natura platformei Jasper, fiind bazată pe comenzi și acțiuni predefinite, limitează capacitatea de convorbire, dar oferă un cadru potrivit pentru un asistent digital, acesta fiind și scopul proiectului.

ደረጃ 5 - ተግባራዊ ያድርጉ

  1. እኔ በስርዓቱ ስርዓት ውስጥ ኦፔራሬ Raspbian pe cardul microSD
  2. እኔ conectat ካሜራ difi difuzorul la Raspberry
  3. እኔ በስርዓተ -ፆታ ደ operare ፣ după care am instalat toate bibliotecile și serviciile necesare, urmând toți pașii din acest ghid:
  4. እኔ የተፈጠርኩበት ሞዱል አዲሲዮኔል ፔንትሩ እና ለዓለም አቀፉ ተግባር

ደረጃ 6: መገልገያ

Image
Image
ጠቃሚ
ጠቃሚ
ጠቃሚ
ጠቃሚ

ዲን ሊፕሳ ዩኑይ ሞኒተርን በማዋቀር ረገድ ከኮምፒዩተር ገመድ አልባ ቅድመ-ትርጓሜ ፣ ተቆጣጣሪ ዲስፖዚቲቪሉይ ራዕይ-ሴን ኤስ ኤስ ኤስ ኤስ። ጃስፐር permite două tipuri de interacțiune:

  1. ፕሪን ተርሚናል (ጽሑፍ) - ላ rularea comenzii jasper_cli
  2. ፕሪን voce - ላ rularea comenzii jasper

ዲን ቀለል ለማድረግ voi începe demonstrarea funcționalității prin intermediul terminalului. ላ rularea comenzii jasper_cli va fi afișat un mesaj de întâmpinare, iar Jasper este gata să primească comenzi. የህትመት ሥራውን ማተም ፣

  • DEFINE + cuvânt - የቃላት ዝርዝር መግለጫ
  • ማን ፣ ምን ፣ ስንት ፣ ስንት ፣ ዕድሜው + cuvânt - folosește API -ul wolframalpha pentru a răspunde la întrebări generale
  • WIKI - folosește API - ul de la wikipedia pentru a oferi informații despre diferite noțiuni
  • ጆክ - spune o glumă
  • LUMOS/NOX - aprinde/stinge LED -ul atașat
  • ትሪቪያ
  • ፊልሞች - informații despre filme (imdb)
  • ዜና - citește știri

በሞዱል voce ፣ deschis la introdure comenzii “jasper” linn linia de comandă ፣ dispozitivul se pune în modul de așteptare, acesta fiind trezit la auzirea unui cuvânt-cheie. Can cazul de față cuvâtul cheie este "ጃስፐር"። După ce dispozitivul a auzit cuvântul cheie, acesta intră în modul de ascultare, putând să primească comenzi exact ca și în modul text. După executarea comenzii, dispozitivul intră din nou în așteptare până la o nouă trezire a sa.

የሚመከር: