한민정

천천히 하지만 확실히 성장하는 백엔드 개발자

기술을 통해 일상의 비효율을 해결하고, 사용자에게 실질적인 시간을 선물하는 과정에 매력을 느낍니다. 제한된 시간 안에서도 핵심 기능(MVP)을 빠르게 정의하고 완성도 있게 구현해내는 실행력 있는 개발자가 되고 싶습니다.

Technical Skills

Backend
Spring Boot Java Spring Security JWT WebFlux BCrypt
Frontend
React JavaScript Vite Axios
AI & API
OpenAI API Whisper (STT) GPT Prompt Engineering
Infrastructure
Git GitHub

Featured Project

기록을 넘어 행동으로, AI 기반 자동 요약 및 Action Item 추출 서비스

기획 의도 및 목표 (Goal)

Archiving to Productivity

기존 서비스는 '정확한 기록'에만 집중하여 다시 읽어야 하는 비효율이 존재했습니다. Action-Log는 기록을 넘어 실질적인 생산성 향상에 집중합니다.

Actionable Insight

단순한 텍스트 변환을 넘어, 회의 직후 즉시 행동으로 옮길 수 있는 Action Item(할 일 목록)을 제공하는 것을 핵심 목표로 삼았습니다.

핵심 개발 기능 (Features)

Whisper API 기반 정밀 STT

OpenAI의 Whisper 모델을 활용하여 다화자 회의 녹음 파일을 높은 정확도의 텍스트로 변환합니다.

자동 요약 및 Action Item 추출

긴 줄글 형태의 스크립트를 분석하여 3줄 핵심 요약과 체크리스트 형태의 실행 과제를 자동으로 추출합니다.

LLM 응답의 구조화 (JSON Mode)

프롬프트 엔지니어링을 통해 LLM의 응답을 JSON 포맷으로 강제하여, 시스템 간 데이터 연동성과 안정성을 확보했습니다.

🏗️ System Architecture

React(SPA) + Spring Boot (WebFlux) + OpenAI API

시스템 아키텍처 다이어그램
01. Non-blocking I/O 기반 안정성 확보

대용량 오디오 파일 처리 시 발생할 수 있는 서버의 스레드 차단(Blocking)을 방지하기 위해 Spring WebFlux (WebClient)를 도입했습니다. 이를 통해 다수의 사용자가 동시에 요약을 요청해도 서버가 멈추지 않고 안정적으로 처리합니다.

02. JSON Mode & 프롬프트 엔지니어링

LLM의 비정형 텍스트 반환 문제를 해결하기 위해 JSON Mode를 강제하는 프롬프트를 설계했습니다. 페르소나 부여와 제약 조건 명시를 통해 프론트엔드에서 별도 파싱 로직 없이 즉시 UI에 렌더링 가능한 데이터 정합성을 확보했습니다.

👥 타겟 사용자 및 타서비스 비교 분석표

Target Audience 시간이 부족한 개발자 효율을 중시하는 기획자(PM) 회의/강의 요약이 필요한 학생
Features Existing Services (ClovaNote 등) Action-Log (본 서비스)
핵심 가치 정확한 기록 및 검색 (Archiving) 빠른 요약 및 행동 유도 (Productivity)
결과물 긴 줄글 형태의 스크립트 3줄 요약 + Action Item 체크리스트
사용자 경험 다시 읽고 정리해야 함 (비효율) 정리된 결론만 확인하면 됨 (효율)

📊 성과 지표 (KPI Analysis)

95%
시간 효율성 향상

1시간 분량 회의 처리 시간
60분 → 3분으로 단축

99%
데이터 정합성 확보

JSON Mode 도입으로
구조화 데이터 변환 오류 해결

92%
핵심 정보 재현율

Prompt Engineering을 통한
정보 누락 방지 및 환각 최소화

💡 Retrospective

🙆‍♂️ 배운 점 (Learned)

  • 프롬프트 엔지니어링이 서비스 품질을 결정하는 핵심 기술임을 체감했습니다.
  • AI 모델 성능만큼이나 AI와의 '소통 방식(JSON 강제 등)'이 중요함을 깨달았습니다.
  • 비동기 처리(WebFlux)를 통해 대용량 요청을 효율적으로 관리하는 법을 익혔습니다.

🚀 향후 계획 (Future Plan)

  • 화자 분리(Speaker Diarization): '누가' 말했는지 식별하여 업무 자동 할당
  • 외부 협업 툴 연동: Jira 티켓 생성, Slack 알림 등 파이프라인 확장
  • RAG 기반 회의 지식소: 축적된 회의록 벡터 DB 구축 및 Q&A 챗봇 구현
  • WebSocket 스트리밍: 실시간 음성-텍스트 변환 파이프라인 구축