AI가 영상 상황 이해 현실적 효과음 생성…물체 질량·속도 추론

    작성자 정보

    • 먹튀헌병대 작성
    • 작성일

    컨텐츠 정보

    본문

    김준호기자 구독 구독중
    이전 다음

    KAIST 등 소리 자동 구현 AI 개발…영화·게임 등 음향 제작 자동화

    기술 개념도
    기술 개념도

    [KAIST 제공. 재판매 및 DB 금지]

    (대전=연합뉴스) 김준호 기자 = 한국과학기술원(KAIST)은 전산학부 오태현 교수 연구팀이 영상 속 상황을 이해해 보다 현실감 있는 소리를 생성하는 인공지능(AI) 기술 '파바스'(PAVAS)를 개발했다고 26일 밝혔다.

    POSTECH·소니 AI가 참여한 공동 연구진은 영상 속 물체의 질량과 속도 등 눈에 보이지 않는 물리 정보를 AI가 스스로 추론하도록 설계했다.

    일반적인 영상에는 물체의 정확한 무게나 속도가 숫자로 제시되지 않지만, 연구팀은 AI가 주변 환경과 움직임의 맥락을 분석해 이를 추정하고 그 결과를 소리 생성 과정에 반영하도록 했다.

    단순히 '무엇이 보이는지'를 인식하는 수준을 넘어 '왜 이런 소리가 발생해야 하는지'에 대한 물리적 원인까지 AI가 이해하도록 만든 것이다.

    기술 검증 결과, 연구팀의 AI는 물체 간 충돌이나 타격 등 물리적 상호작용이 발생하는 장면에서 실제 환경과 매우 유사한 소리를 생성했다. 물체 질량·속도가 달라질 때 소리 크기·음색도 자연스럽게 변화하는 등 보다 현실감 있는 음향을 구현했다고 연구팀은 설명했다.

    파바스는 영상 속 객체의 움직임과 충돌 특성을 분석해 장면과 정밀하게 맞아떨어지는 현실적인 효과음을 생성했다고 연구팀은 덧붙였다.

    향후 이 기술은 콘텐츠 음향 제작 자동화는 물론 증강현실(AR)·가상현실(VR) 콘텐츠, 메타버스, 로보틱스 시뮬레이션 등 다양한 분야에서 더욱 몰입감 있는 사용자 경험을 제공할 수 있을 것으로 기대된다.

    오태현 교수는 "향후 텍스트·영상·음성 등 다양한 정보를 동시에 이해하고 처리하는 차세대 AI의 핵심 기반 기술로 확장될 수 있을 것"이라고 말했다.

    [email protected]

    관련자료

    댓글 0
    등록된 댓글이 없습니다.
    전체 9,801 / 1 페이지
    공지
    리그별 팀순위
    레벨 랭킹
    포인트 랭킹
    • 스텔스
      LV. 8
    • 가자아
      LV. 4
    • 강호라니
      LV. 4
    • 4
      빡빡이
      LV. 3
    • 5
      히딩크
      LV. 3
    • 6
      묵반나편
      LV. 2
    • 7
      임평정도
      LV. 2
    • 8
      택양엄편
      LV. 2
    • 9
      천진신제
      LV. 2
    • 10
      열훔훔만
      LV. 2
    • 스텔스
      71,100 P
    • 가자아
      16,800 P
    • 강호라니
      14,500 P
    • 4
      빡빡이
      12,400 P
    • 5
      히딩크
      8,100 P
    • 6
      여우눈
      6,000 P
    • 7
      등억골
      5,100 P
    • 8
      진실의방으로
      4,200 P
    • 9
      묵반나편
      3,300 P
    • 10
      찬충뜸신
      3,300 P