Speech AI Research Intern
Qualcomm
On-Site
Korea / Japan / Singapore (GMT+9)
Contract/ Temporary
Internship
We are seeking passionate research interns to advance state-of-the-art speech-language technologies. This unique internship offers a chance to contribute to foundational and applied research in speech-based large language models (LLMs), multimodal emotion understanding, and on-device conversational AI agents. The ideal candidate has a strong background in speech recognition, text-to-speech, emotion recognition, spoken dialogue systems, or multi-modal generative models, focusing on empathetic intelligent systems.

Key Research Areas

  • Full-duplex and empathetic spoken dialogue systems.
  • Representation learning of audio and speech data.
  • Multimodal emotion recognition using speech and text.
  • Speech-language model adaptation and fine-tuning for on-device deployment.

Minimum Qualifications

  • Currently pursuing a Bachelor's, Master's, or Ph.D. degree in Computer Science, Electrical and Electronic Engineering, or a related field.
  • Proficiency in Python and experience with machine learning frameworks (e.g., PyTorch).
  • Solid understanding of speech processing or natural language processing concepts.
  • Availability for a minimum of 6 months.

Preferred Qualifications

  • Prior research or hands-on project experience in: speech recognition, text-to-speech, speech self-supervised learning, speech emotion recognition, or large language models.
  • Strong background in representation learning for speech and audio data.
  • Experience with multimodal generative AI (integrating speech, text, and/or visual modalities).
  • Proven track record of academic contributions (publications, conference presentations).
  • Broad and in-depth understanding of machine learning and deep learning principles.

최첨단 음성-언어 기술 발전에 기여할 열정적이고 의욕적인 연구 인턴을 찾습니다. 이 인턴십은 음성 기반 대규모 언어 모델(LLMs), 다중 모드 감정 이해, 온디바이스 대화형 AI 에이전트에 대한 기초 및 응용 연구에 기여할 수 있는 독특한 기회를 제공합니다. 이상적인 후보는 음성 인식, 텍스트-음성 변환, 감정 인식, 음성 대화 시스템 또는 다중 모드 생성 모델에 대한 강력한 배경을 가지고 있어야 하며, 인간의 의사소통을 이해하고 공감적으로 반응하는 지능형 시스템 구축에 중점을 두어야 합니다. 선정된 후보는 다음 영역 중 하나 이상에서 작업하게 됩니다.

주요 연구 분야

  • 양방향 및 공감적인 음성 대화 시스템.
  • 오디오 및 음성 데이터의 표현 학습.
  • 음성 및 텍스트를 사용한 다중 모드 감정 인식.
  • 온디바이스 배포를 위한 음성-언어 모델 적응 및 미세 조정.

최소 자격

  • 현재 컴퓨터 과학, 전기 및 전자 공학 또는 관련 분야에서 학사, 석사 또는 박사 학위 과정 재학 중.
  • Python 능숙 및 머신러닝 프레임워크(예: PyTorch) 경험.
  • 음성 처리 또는 자연어 처리 개념에 대한 확실한 이해.
  • 최소 6개월 근무 가능.

우대 자격

  • 다음 영역 중 하나 이상에서 사전 연구 또는 실무 프로젝트 경험: 음성 인식, 텍스트-음성 변환, 음성 자기 지도 학습, 음성 감정 인식 또는 대규모 언어 모델.
  • 음성 및 오디오 데이터의 표현 학습에 대한 강력한 배경.
  • 음성, 텍스트 및/또는 시각적 양식을 통합하는 다중 모드 생성 AI 경험.
  • 최상위 학술 회의에서의 연구 출판물 또는 발표를 포함한 학술 기여 실적.
  • 머신러닝 및 딥러닝 원리, 알고리즘 및 아키텍처에 대한 광범위하고 심층적인 이해.

Apply Now

Please mention you found this job on Remowrk in your application. This helps us grow!

Apply Now

Get early access to remote job drops.

New opportunities delivered to your inbox, weekly.

By clicking Subscribe you're confirming that you agree with our Terms and Conditions.
🎉 You’re in! Thanks for joining Remowrk’s global career circle 🌍
Check your inbox to confirm your subscription—sometimes it might land in your spam folder. 📬
Oops! Something went wrong while submitting the form.