프로메테우스 4기 프로젝트

🔥 라즈베리파이를 사용한 나만의 인공지능 스피커 만들기

<aside> <img src="/icons/verified_blue.svg" alt="/icons/verified_blue.svg" width="40px" /> 파이썬 좀 쓸 줄 아는 놈이라면… 나만을 위한 스피커는 직접 만들 줄 알아야 하지 않겠어? 🤓

</aside>

<aside> <img src="/icons/verified_blue.svg" alt="/icons/verified_blue.svg" width="40px" /> Objective: 라즈베리파이(미니 컴퓨터)로 우리가 직접 만든 모델을 얹은 인공지능 스피커를 만들자!

</aside>

<aside> <img src="/icons/verified_blue.svg" alt="/icons/verified_blue.svg" width="40px" /> Method : HW — 라즈베리파이+스피커+마이크장치 SW — 제작한 모델 + API(Fast API Local, Huggingface&Google&OpenAI api)

</aside>

👥 팀원

Untitled

HW 팀
SW 팀

🛠️ Skills

🖥️ Github link

https://github.com/alrbs10/ai-speaker

💻 구현

서버

서버 On (request 대기 중)
Post로 온 요청에서 파일 자기 서버 내부 파일로 저장
저장된 wav파일의 음성 입력을 -whisper에서는 화자 정보 추출(연령) -google stt로 text 로 바꾸기
Chat gpt prompt로 화자 정보와 text, 문맥에 따른 답변 생성
Post 요청에 대한 응답으로 답변(text) 보내기
여기서도 답변 보낸 후 저장했던 음성 파일 삭제

라즈베리 파이 스피커

사용자가 음성을 입력
라즈베리 파이 내에서 녹음 후 파일 저장 ( (timestamp).wav )
서버에 저장한 파일 Post 요청 보내고 응답 대기
응답받은 text파일을 Google tts로 wav 파일로 저장( (timestamp).wav)
저장한 파일을 자동 재생
파일 두개 모두 삭제(처음 녹음, 답변 음성 파일)

일정표

회의록

활동 사진