1. 포지션 개요 (Position Overview)
우리는 쏟아지는 금융 정보(뉴스, 공시, 리포트)를 단순히 보여주는 것을 넘어, AI를 활용해 투자자에게 가장 필요한 인사이트로 재가공하여 웹서비스와 API로 제공하고자 합니다.
이 포지션은 백엔드에서 LLM을 활용해 원문 데이터를 요약, 분석, 번역하고, 웹페이지 UI 컴포넌트에 적합한 형태(JSON, Markdown 등)로 변환하는 "AI 기반 콘텐츠 생성 파이프라인"을 책임지게 됩니다.
2. 주요 업무 (Responsibilities)
- AI 콘텐츠 생성 ETL 파이프라인 개발:
- 실시간 뉴스, DART 공시, 증권사 리포트 텍스트를 입력받아 투자 핵심 요약, 긍/부정 분석, 키워드 추출을 수행하는 자동화 로직 구현.
- LLM API를 활용해 웹서비스용 메타 데이터(타이틀, 태그, 3줄 요약) 생성 및 검수.
- LLM 프롬프트 최적화 및 모델 제어:
- 금융 데이터의 뉘앙스를 정확히 파악하고, 환각(Hallucination)을 최소화하기 위한 System Prompt 설계 및 최적화.
- Structured Output(JSON 모드)을 활용하여, LLM의 결과물이 프론트엔드 코드에서 깨지지 않고 완벽하게 렌더링되도록 구조화.
- 콘텐츠 품질 관리 및 검증:
- AI가 생성한 콘텐츠의 정합성을 검증하는 자동화 테스트(Eval) 구축.
- 뉴스 클러스터링 및 타임라인 생성 로직 구현
- 백엔드 API 연동:
- 생성된 콘텐츠를 DB에 적재하고, 프론트엔드 요청에 맞춰 빠르게 서빙하는 RESTful API 개발.
3. 자격 요건 (Basic Qualifications)
- 구조적 사고와 논리 설계 능력 보유 (문제 분해 → 제약 조건 설정 → 메타인지)
- 금융 데이터 처리에 대한 관심 및 학습 의지
- 수작업으로 사람이 판단하는 것들을 자동화하고 에러율을 낮추기 위해 고민한 경험 보유
- Python 백엔드 개발 역량: FastAPI 기반의 서버 개발 및 데이터 처리 경험.
- LLM 활용 및 프롬프트 엔지니어링 경험:
- Few-shot Prompting, CoT, ToT 등 고급 프롬프팅 기법을 이해하고 적용해 본 분.
- LLM의 출력을 단순 텍스트가 아닌 JSON/XML 등 구조화된 데이터로 제어해 본 경험.
- 비동기 처리 및 최적화: LLM API의 응답 지연(Latency)을 고려하여 비동기(Async) 큐를 활용한 사용자 경험 최적화 역량.
4. 우대 사항 (Preferred Qualifications)
- 웹크롤링 숙련자
- Airflow, Dagster, n8n 등을 활용하여 워크플로우를 구축해본 경험
- 금융 콘텐츠/도메인 이해도가 높으신 분
- 최신 LLM Engineering 트렌드 팔로업:
- 'Structured Outputs', Anthropic의 'Prompt Caching', ‘Skills’ 등 신규 api 기능들을 테스트하고 빠르게 서비스에 적용할 수 있는 분.
- RAG 파이프라인 구축 경험