Software Engineer, AI (C#)
G2i Inc.
Remote
Anywhere / Flexible
Full-Time
Mid-Level
We are seeking a Software Engineer, AI (C#) to help train large-language models (LLMs) to write production-grade code. This fully remote role is central to improving AI-generated code across various programming languages through human feedback. You will compare, rank, repair, refactor, and provide detailed explanations for code snippets, directly influencing the model's learning process.

Your Impact

You'll be instrumental in the Reinforcement Learning with Human Feedback (RLHF) pipeline:

  • Compare & rank multiple code snippets, clearly explaining the best approach and its rationale.
  • Repair & refactor AI-generated code for correctness, efficiency, and style.
  • Inject feedback (ratings, edits, test results) into the RLHF pipeline to ensure its smooth operation.
  • The ultimate goal is to teach the AI model to propose, critique, and improve code just like an expert engineer would.

What You’ll Need

  • 3+ years of professional software engineering experience in C#. (Constraint programming experience is a bonus).
  • Strong code-review instincts: Ability to quickly spot logic errors, performance traps, and security issues.
  • Extreme attention to detail and excellent written communication skills: A significant part of this role involves explaining why one approach is superior to another.
  • Enjoy reading documentation and language specifications.
  • Thrive in an asynchronous, low-oversight remote environment.

What You Don't Need

  • No prior RLHF or AI training experience is required.
  • No deep machine learning knowledge is necessary. We will teach you if you can clearly review and critique code.

Tech Stack

  • C# is the core language we're looking for.

Logistics

  • Location: Fully remote – work from anywhere.
  • Compensation: $30/hr to $70/hr, based on location and seniority.
  • Hours: Minimum 15 hours/week, with up to 40 hours/week available.
  • Engagement: 1099 contract.

If you're an expert C# engineer with sharp code review instincts and a knack for clear communication, looking for direct impact in AI training, this is for you!

저희는 프로덕션 수준의 코드를 다양한 프로그래밍 언어로 작성하도록 대규모 언어 모델(LLM)을 훈련시키는 데 도움을 줄 AI 소프트웨어 엔지니어(C#)를 찾고 있습니다. 이 완전 원격 포지션은 인간 피드백을 통해 AI가 생성한 코드의 품질을 향상시키는 데 핵심적인 역할을 합니다. 여러 코드 스니펫을 비교, 순위 지정, 수정 및 리팩토링하고 자세한 설명을 제공하여 모델의 학습 과정에 직접적인 영향을 미 미칠 것입니다.

당신의 역할

당신은 인간 피드백 기반 강화 학습(RLHF) 파이프라인에서 중요한 역할을 수행할 것입니다:

  • 여러 코드 스니펫을 비교 및 순위 지정하고, 어떤 것이 최고이며 그 이유는 무엇인지 명확하게 설명합니다.
  • 정확성, 효율성 및 스타일에 맞춰 AI 생성 코드를 수정 및 리팩토링합니다.
  • RLHF 파이프라인에 피드백(평가, 수정, 테스트 결과)을 주입하여 원활하게 작동하도록 합니다.
  • 최종 목표는 AI 모델이 실제 배포할 만한 코드를 제안하고, 비판하며, 개선하는 방법을 학습하도록 하는 것입니다.

필요 역량

  • C# 전문 소프트웨어 엔지니어링 경력 3년 이상. (제약 조건 프로그래밍 경험은 우대 사항이지만 필수는 아닙니다.)
  • 뛰어난 코드 검토 능력 — 논리 오류, 성능 함정, 보안 문제를 빠르게 파악할 수 있습니다.
  • 극도의 세부 사항 주의력과 뛰어난 작문 커뮤니케이션 능력. 이 역할의 상당 부분은 특정 접근 방식이 다른 방식보다 왜 더 나은지 설명하는 것을 포함합니다. 이는 아무리 강조해도 지나치지 않습니다.
  • 문서와 언어 사양을 읽는 것을 즐기며, 비동기적이고 낮은 감독 환경에서 잘 적응합니다.

불필요한 역량

  • 이전 RLHF(인간 피드백 기반 강화 학습) 또는 AI 훈련 경험은 필요하지 않습니다.
  • 깊이 있는 머신러닝 지식은 필요하지 않습니다. 코드를 명확하게 검토하고 비판할 수 있다면, 나머지는 저희가 가르쳐 드립니다.

기술 스택

  • C#이 저희가 찾고 있는 핵심 언어입니다.

근무 조건

  • 근무지: 완전 원격 — 전 세계 어디서든 근무 가능.
  • 보상: 시니어리티 및 지역에 따라 시간당 $30 ~ $70.
  • 근무 시간: 최소 주 15시간, 최대 주 40시간 가능.
  • 고용 형태: 1099 계약직.

날카로운 코드 검토 능력과 명확한 의사소통 능력을 갖춘 C# 전문가로서 AI 훈련에 직접적인 영향을 미치고 싶다면, 지금 지원하세요!

Apply Now

Please mention you found this job on Remowrk in your application. This helps us grow!

Apply Now

Get early access to remote job drops.

New opportunities delivered to your inbox, weekly.

By clicking Subscribe you're confirming that you agree with our Terms and Conditions.
🎉 You’re in! Thanks for joining Remowrk’s global career circle 🌍
Check your inbox to confirm your subscription—sometimes it might land in your spam folder. 📬
Oops! Something went wrong while submitting the form.