<aside> <img src="/icons/verified_blue.svg" alt="/icons/verified_blue.svg" width="40px" /> 파이썬 좀 쓸 줄 아는 놈이라면… 나만을 위한 스피커는 직접 만들 줄 알아야 하지 않겠어? 🤓
</aside>
<aside> <img src="/icons/verified_blue.svg" alt="/icons/verified_blue.svg" width="40px" /> Objective: 라즈베리파이(미니 컴퓨터)로 우리가 직접 만든 모델을 얹은 인공지능 스피커를 만들자!
</aside>
<aside> <img src="/icons/verified_blue.svg" alt="/icons/verified_blue.svg" width="40px" /> Method : HW — 라즈베리파이+스피커+마이크장치 SW — 제작한 모델 + API(Fast API Local, Huggingface&Google&OpenAI api)
</aside>
HW 팀
SW 팀
HW
SW
https://github.com/alrbs10/ai-speaker
서버 On (request 대기 중)
Post로 온 요청에서 파일 자기 서버 내부 파일로 저장
저장된 wav파일의 음성 입력을 -whisper에서는 화자 정보 추출(연령) -google stt로 text 로 바꾸기
Chat gpt prompt로 화자 정보와 text, 문맥에 따른 답변 생성
Post 요청에 대한 응답으로 답변(text) 보내기
여기서도 답변 보낸 후 저장했던 음성 파일 삭제
사용자가 음성을 입력
라즈베리 파이 내에서 녹음 후 파일 저장 ( (timestamp).wav )
서버에 저장한 파일 Post 요청 보내고 응답 대기
응답받은 text파일을 Google tts로 wav 파일로 저장( (timestamp).wav)
저장한 파일을 자동 재생
파일 두개 모두 삭제(처음 녹음, 답변 음성 파일)