본문 바로가기
IT/Knowledge

Whisper AI 란?

by 성준하이 2024. 5. 18.
반응형

요즘 매체들이 다양해지고, AI 기술이 많이 발전하였다.

 

그러면서 함께 나오는 기술이 유투브에 있는 동영상에 대한 자막을 따올수가 있게 되었다.

 

이런 기술을 OpenAI 에서 Whisper AI 라는 이름으로 개발 하였다.

https://openai.com/index/whisper/

 

 

아래 사이트는 나무위키에서 Whisper AI 에 대해 기술한 내용이다.

https://namu.wiki/w/Whisper(AI)

 

Whisper(AI)

OpenAI 에서 개발한 자동 음성 인식(Automatic Speech Recognition, ASR) 모델이다.

namu.wiki

자동 번역 자막 기능인데,

사용법은 아래 3가지가 있다.

 

Faster Whisper Webui - a Hugging Face Space by aadnk

 

huggingface.co

에서 들어가서 동영상을 업로드 하거나 url 주소를 기입하면 된다.

 

  • 구글 코랩 이용
    코랩 관련해서는 아래 참고 포스팅 참고 바란다.
    코랩에서 ipython 파일로 아래 스크립트를 하나씩 작성해주면된다.
!git clone https://huggingface.co/spaces/aadnk/whisper-webui

!cd whisper-webui/ && git pull origin

!cd whisper-webui/ && pip install -r requirements.txt

!cd whisper-webui/ && python app.py --input_audio_max_duration -1 --share True

 

  • 설치
    이 방법은 직접 진행은 해보지 못했다.
    AI기술을 로컬에서 직접 돌리기엔 스펙이 충분하지 않아, 추후 작업이 된다면 작성 예정이다.

참고 포스팅

https://thenicesj.tistory.com/627

 

Colab 이란?

Google 에서 제공하는 Colab은 Google 에서 제공하는 jupyter notebook 이다. local의 jupyter notebook 에 관해서는 아래 참고 포스팅을 참고 바란다. jupyter notebook은 물론 서버에 설치도 가능하지만 local에서 돌

thenicesj.tistory.com

 

반응형

'IT > Knowledge' 카테고리의 다른 글

Chat GPT 4o 모델  (9) 2024.05.24
IT 거버넌스란?  (6) 2024.05.23
IT 란?  (18) 2024.05.14
JMeter 란?  (9) 2024.05.06
DRM 이란?  (13) 2024.04.27

댓글