
Your Impact
You'll be a key contributor to our Reinforcement Learning with Human Feedback (RLHF) pipeline:
- Compare and rank multiple code snippets, clearly explaining the advantages and disadvantages of each.
- Repair and refactor AI-generated code to ensure it meets standards for correctness, efficiency, and style.
- Inject valuable feedback (including ratings, edits, and test results) into the RLHF pipeline to maintain its smooth operation and continuous improvement.
The ultimate goal? To help the AI model learn to propose, critique, and enhance code just like a seasoned human engineer would.
What You'll Need
- 3+ years of professional software engineering experience in JavaScript.
- Strong code-review instincts: You can quickly identify logic errors, performance bottlenecks, and security vulnerabilities.
- Exceptional attention to detail and outstanding written communication skills: A significant part of this role involves clearly articulating why one coding approach is superior to another.
- A genuine enjoyment for reading documentation and language specifications.
- The ability to thrive independently in an asynchronous, low-oversight remote work environment.
What You Won't Need
- No prior experience with RLHF (Reinforcement Learning with Human Feedback) or AI training is necessary.
- Deep machine learning knowledge is not a prerequisite. If you can clearly review and critique code, we'll teach you everything else you need to know.
Tech Stack
- Our primary focus is on engineers with a strong command of JavaScript.
Logistics
- Location: This is a fully remote position, allowing you to work from anywhere in the world.
- Compensation: Hourly pay ranges from $30 to $70, determined by your location and level of seniority.
- Hours: You can work a minimum of 15 hours per week, with the option to go up to 40 hours per week.
- Engagement: This role operates as a 1099 contract.
If you're an expert JavaScript engineer with sharp code review skills and a talent for clear communication, eager to make a direct impact on AI training, we encourage you to apply!
주요 업무
당신은 저희의 인간 피드백 기반 강화 학습(RLHF) 파이프라인에 핵심적인 기여자가 될 것입니다:
- 여러 코드 스니펫을 비교 및 순위 지정하고, 각 방식의 장점과 단점을 명확하게 설명합니다.
- 정확성, 효율성 및 스타일 기준을 충족하도록 AI가 생성한 코드를 수정 및 리팩토링합니다.
- RLHF 파이프라인에 가치 있는 피드백(평가, 수정, 테스트 결과 포함)을 주입하여 원활한 작동과 지속적인 개선을 보장합니다.
궁극적인 목표는 AI 모델이 숙련된 인간 엔지니어처럼 코드를 제안하고, 비판하며, 개선하는 방법을 학습하도록 돕는 것입니다.
필요 역량
- JavaScript 전문 소프트웨어 엔지니어링 경력 3년 이상.
- 뛰어난 코드 검토 능력: 논리 오류, 성능 병목 현상, 보안 취약점을 신속하게 식별할 수 있습니다.
- 탁월한 세부 사항 주의력과 뛰어난 작문 커뮤니케이션 능력: 이 역할의 상당 부분은 특정 코딩 방식이 왜 더 우월한지 명확하게 설명하는 것을 포함합니다.
- 문서와 언어 사양을 읽는 것을 진정으로 즐기는 분.
- 비동기적이고 감독이 적은 원격 근무 환경에서 독립적으로 잘 적응하는 분.
불필요한 역량
- 이전 RLHF(인간 피드백 기반 강화 학습) 또는 AI 훈련 경험은 필요하지 않습니다.
- 깊이 있는 머신러닝 지식은 필요하지 않습니다. 코드를 명확하게 검토하고 비판할 수 있다면, 필요한 나머지 지식은 저희가 가르쳐 드립니다.
기술 스택
- 저희는 JavaScript에 대한 강력한 명령 능력을 갖춘 엔지니어를 찾고 있습니다.
근무 조건
- 근무지: 완전 원격 포지션으로, 전 세계 어디서든 근무할 수 있습니다.
- 보상: 시간당 급여는 당신의 지역과 시니어리티 수준에 따라 $30에서 $70까지 다양합니다.
- 근무 시간: 최소 주 15시간 근무가 가능하며, 최대 주 40시간까지 근무할 수 있습니다.
- 고용 형태: 이 역할은 1099 계약직으로 운영됩니다.
날카로운 코드 검토 기술과 명확한 의사소통 능력을 갖춘 JavaScript 전문가로서 AI 훈련에 직접적인 영향을 미치고 싶다면, 지금 바로 지원해 주세요!
Get early access to remote job drops.
New opportunities delivered to your inbox, weekly.