ዝርዝር ሁኔታ:

የጉግል ንግግር ኤፒአይ እና ፓይዘን በመጠቀም የንግግር ዕውቅና - 4 ደረጃዎች
የጉግል ንግግር ኤፒአይ እና ፓይዘን በመጠቀም የንግግር ዕውቅና - 4 ደረጃዎች

ቪዲዮ: የጉግል ንግግር ኤፒአይ እና ፓይዘን በመጠቀም የንግግር ዕውቅና - 4 ደረጃዎች

ቪዲዮ: የጉግል ንግግር ኤፒአይ እና ፓይዘን በመጠቀም የንግግር ዕውቅና - 4 ደረጃዎች
ቪዲዮ: ለምን ከOpenAI ChatGPT ሰዎችን የሚያሸብር | አዲስ የሰው ልጅ AI ሮቦቶች ቴክኖሎጂ 2024, ህዳር
Anonim
የንግግር ማወቂያ የጉግል ንግግር ኤፒአይ እና ፓይዘን በመጠቀም
የንግግር ማወቂያ የጉግል ንግግር ኤፒአይ እና ፓይዘን በመጠቀም

የንግግር ዕውቅና

የንግግር ዕውቅና የአርቲፊሻል ኢንተለጀንስ ንዑስ መስክ የሆነው የተፈጥሮ ቋንቋ ማቀነባበር አካል ነው። በቀላሉ ለማስቀመጥ ፣ የንግግር ማወቂያ የኮምፒተር ሶፍትዌር ቃላትን እና ሀረጎችን በንግግር ቋንቋ የመለየት እና ወደ ሰው ሊነበብ ወደሚችል ጽሑፍ የመለወጥ ችሎታ ነው። እንደ የድምፅ ረዳት ስርዓቶች ፣ የቤት አውቶማቲክ ፣ የድምፅ ላይ የተመሠረተ ቻትቦቶች ፣ የድምፅ መስተጋብር ሮቦት ፣ ሰው ሰራሽ የማሰብ ችሎታ እና ወዘተ ባሉ በብዙ መተግበሪያዎች ውስጥ ጥቅም ላይ ውሏል።

ንግግርን ለመለየት የተለያዩ ኤፒአይዎች (የመተግበሪያ ፕሮግራም በይነገጽ) አሉ። ነፃ ወይም የተከፈለ አገልግሎቶችን ይሰጣሉ። እነዚህም -

  • CMU ሰፊኒክስ
  • የጉግል ንግግር ዕውቅና
  • የጉግል ደመና ንግግር ኤፒአይ
  • Wit.ai
  • የማይክሮሶፍት ቢንግ ድምጽ ማወቂያ
  • Houndify ኤፒአይ
  • የ IBM ንግግር ወደ ጽሑፍ
  • የበረዶ መንሸራተቻ ቃል መፈለጊያ

ምንም የኤፒአይ ቁልፍ ስለማይፈልግ የ Google ንግግር ማወቂያን እዚህ እንጠቀማለን። ይህ መማሪያ ከሴይድ ስቱዲዮ እንደ ReSpeaker USB 4-Mic Array በመሳሰሉ ውጫዊ ማይክሮፎን በመታገዝ በፓይዘን ላይ የ Google ንግግር ማወቂያ ቤተ-መጽሐፍት እንዴት እንደሚጠቀሙበት መግቢያ ለማቅረብ ያለመ ነው። ምንም እንኳን ውጫዊ ማይክሮፎን መጠቀም ግዴታ ባይሆንም አብሮገነብ የላፕቶፕ ማይክሮፎን እንኳን መጠቀም ይቻላል።

ደረጃ 1: ድምጽ ማጉያ ዩኤስቢ 4-ማይክ ድርድር

ዳግም ተናጋሪ ዩኤስቢ 4-ማይክ ድርድር
ዳግም ተናጋሪ ዩኤስቢ 4-ማይክ ድርድር
ዳግም ተናጋሪ ዩኤስቢ 4-ማይክ ድርድር
ዳግም ተናጋሪ ዩኤስቢ 4-ማይክ ድርድር
ዳግም ተናጋሪ ዩኤስቢ 4-ማይክ ድርድር
ዳግም ተናጋሪ ዩኤስቢ 4-ማይክ ድርድር

የ ReSpeaker USB Mic በአይዲ ስቱዲዮ የተገነባ ለኤአይ እና ለድምጽ መተግበሪያዎች የተነደፈ ባለአራት ማይክሮፎን መሣሪያ ነው። በክፍሉ ውስጥ ከማንኛውም ቦታ ድምጽዎን ለማንሳት የተነደፉ 4 ከፍተኛ አፈፃፀም ፣ አብሮገነብ በሁሉም አቅጣጫ የማይክሮፎኖች እና 12 በፕሮግራም ሊሠሩ የሚችሉ የ RGB LED አመልካቾች አሉት። የ ReSpeaker USB ማይክሮፎን ሊኑክስን ፣ ማክሮን እና ዊንዶውስ ኦፐሬቲንግ ሲስተሞችን ይደግፋል። ዝርዝሮች እዚህ ሊገኙ ይችላሉ።

የ ReSpeaker USB ማይክሮፎን የሚከተሉትን ዕቃዎች የያዘ በጥሩ ጥቅል ውስጥ ይመጣል-

  • የተጠቃሚ መመሪያ
  • ReSpeaker USB Mic Array
  • ማይክሮ ዩኤስቢ ወደ ዩኤስቢ ገመድ

ስለዚህ ለመጀመር ዝግጁ ነን።

ደረጃ 2 - አስፈላጊ ቤተ -ፍርግሞችን ይጫኑ

ለዚህ መማሪያ ፣ እኔ Python 3.x ን እየተጠቀሙ ይመስለኛል።

ቤተመፃሕፍቱን እንጫን ፦

pip3 ጫን SpeechRecognition

ለ macOS ፣ መጀመሪያ ፖርትኦዲዮን ከ Homebrew ጋር መጫን እና ከዚያ PyAudio ን በ pip3 መጫን ያስፈልግዎታል።

ፖርቱዲዮን ይጫኑ

Pyaudio ን ለመጫን ከዚህ በታች ትእዛዝ እንሰራለን

pip3 ጫን pyaudio

ለሊኑክስ ፣ PyAudio ን በተገቢ ሁኔታ መጫን ይችላሉ-

sudo apt-get install python-pyaudio python3-pyaudio

ለዊንዶውስ ፣ PyAudio ን ከ pip ጋር መጫን ይችላሉ-

pip install pyaudio

አዲስ የፓይዘን ፋይል ይፍጠሩ

ናኖ get_index.py

ከኮድ ቁራጭ በታች በ get_index.py ላይ ይለጥፉ

pyaudio ማስመጣት

p = pyaudio. '))> 0: ማተም ("የግቤት መሣሪያ መታወቂያ" ፣ እኔ ፣ " -" ፣ p.get_device_info_by_host_api_device_index (0, i).get (' ስም '))

የሚከተለውን ትዕዛዝ ያሂዱ:

python3 get_index.py

በእኔ ሁኔታ ትዕዛዙ የሚከተለውን ውጤት ወደ ማያ ገጽ ይሰጣል-

የግቤት መሣሪያ መታወቂያ 1 - ድምጽ ማጉያ 4 ማይክ ድርድር (UAC1.0)

የግቤት መሣሪያ መታወቂያ 2 - ማክቡክ አየር ማይክሮፎን

ከዚህ በታች ባለው ኮድ ቅንጭብ ውስጥ በመረጡት መሠረት የመሣሪያ_መረጃን ወደ የመረጃ ጠቋሚ ቁጥር ይለውጡ።

የንግግር_እውቅና እንደ ኤስ አር አስመጣ

r = sr. Recognizer () speech = sr. Microphone (device_index = 1) ከንግግር እንደ ምንጭ: ማተም ("አንድ ነገር ይናገሩ! …") ድምጽ = r.adjust_for_ambient_noise (ምንጭ) ኦዲዮ = r.listen (ምንጭ) ይሞክሩ: recog = r. ("ከ Google ንግግር ማወቂያ አገልግሎት ውጤቶችን መጠየቅ አልቻልኩም ፤ {0}"። ቅርጸት (ሠ))

በ ReSpeaker 4 Mic Micray እንደ የመሣሪያ መረጃ ጠቋሚ 1 ተመርጧል።

ደረጃ 3 ከፓትስክስ 3 ቤተ-መጽሐፍት ጋር በ Python ውስጥ ጽሑፍ-ወደ-ንግግር

በፓይዘን ውስጥ ጽሑፍን ወደ ንግግር ለመለወጥ በርካታ ኤፒአይዎች አሉ። ከእንደዚህ ዓይነት ኤፒአይዎች አንዱ በእኔ አስተያየት በጣም ጥሩ የሚገኝ የጽሑፍ-ወደ-ንግግር ጥቅል የሆነው pyttsx3 ነው። ይህ ጥቅል በዊንዶውስ ፣ ማክ እና ሊኑክስ ውስጥ ይሠራል። ይህ እንዴት እንደሚደረግ ለማየት ኦፊሴላዊውን ሰነድ ይመልከቱ።

ጥቅሉን ይጫኑ ጥቅሉን ለመጫን ፒፕ ይጠቀሙ።

pip install pyttsx3

በዊንዶውስ ውስጥ ከሆኑ ቤተኛውን የዊንዶውስ ንግግር ኤፒአይ ለመድረስ የሚያስፈልገው ተጨማሪ ጥቅል ፣ pypiwin32 ያስፈልግዎታል።

pip ጫን pypiwin32

ጽሑፍን ወደ ንግግር ፓይዘን ስክሪፕት ይለውጡ pyttsx3 ን በመጠቀም ለጽሑፍ ወደ ንግግር የኮድ ቁራጭ ነው።

አስመጪ pyttsx3

ሞተር = pyttsx3.init ()

engine.setProperty ('rate', 150) # የፍጥነት መቶኛ

engine.setProperty ('volume' ፣ 0.9) # ጥራዝ 0-1

engine.say (“ሰላም ፣ ዓለም!”)

engine.runAndWait ()

ደረጃ 4 - ሁሉንም አንድ ላይ ማድረግ - የንግግር ማወቂያ ኤፒአይ እና ፒትትክስ 3 ቤተመፃሕፍት በመጠቀም የንግግር ማወቂያን በፓይዘን መገንባት

ከዚህ በታች ያለው ኮድ የጉግል ንግግር ማወቂያን በመጠቀም የሰውን ንግግር የማወቅ እና pyttsx3 ቤተ -መጽሐፍት በመጠቀም ጽሑፉን ወደ ንግግር የመለወጥ ኃላፊነት አለበት።

የንግግር_እውቅና እንደ ኤስ አር አስመጣ

አስመጪ pyttsx3 ሞተር = pyttsx3.init () engine.setProperty ('rate', 200) engine.setProperty ('volume', 0.9) r = sr. Recognizer () speech = sr. Microphone (device_index = 1) ከንግግር እንደ ምንጭ: ኦዲዮ = r.adjust_for_ambient_noise (ምንጭ) ኦዲዮ = r.listen (ምንጭ) ይሞክሩት: recog = r.recognize_google (ኦዲዮ ፣ ቋንቋ = 'en-US') ህትመት ("እርስዎ እንዲህ ብለዋል" + recog) engine.say (" እርስዎ እንዲህ ብለዋል ፦ “+ recog) engine.runAndWait () ከ SR. UnknownValueError: engine.say (“የጉግል ንግግር ማወቂያ ድምጽን መረዳት አልቻለም”) engine.runAndWait () ከ sr. RequestError በስተቀር እንደ e. engine.say (“አልተቻለም”) ከ Google ንግግር ማወቂያ አገልግሎት ውጤቶችን ይጠይቁ ፤ {0} "። ቅርጸት (ሠ) engine.runAndWait ()

ተርሚናል ላይ ውፅዓት ያትማል። እንዲሁም ወደ ንግግርም ይለወጣል።

እርስዎ እንዲህ አሉ -ለንደን የታላቋ ብሪታንያ ዋና ከተማ ናት

የንግግር ማወቂያን በአጠቃላይ እንዴት እንደሚሰራ እና ከሁሉም በላይ ፣ የጉግል ንግግር ማወቂያ ኤፒአይ ከፓይዘን ጋር እንዴት እንደሚተገበር አሁን የተሻለ ግንዛቤ እንዲኖርዎት ተስፋ አደርጋለሁ።

ማንኛውም ጥያቄ ወይም አስተያየት ካለዎት? ከዚህ በታች አስተያየት ይተው። ይከታተሉ!

የሚመከር: