HOME
회사소개
포트폴리오
커뮤니티
고객평가
갤러리
무료봉사
온라인마케팅
최근 신기술
제작/컨설팅
솔루션
포트폴리오

AI | 사용자에게 고품질의 정확한 답변을 제공하는 검색증강생성 RAG 챗봇(인공지능, AI, 파인튜닝, Gemini, GPT, LLM)

페이지 정보

작성자 최고관리자 작성일25-12-18 12:22 조회30회 댓글0건

본문

 

 

당신의 건강 파트너, 무도 챗봇(인공지능, AI, 파인튜닝, Gemini, GPT, LLM)

나에게 꼭 맞는 교정운동, 이제 AI가 찾아드립니다.

무도챗봇의 핵심은 검색증강생성 RAG 기능!

 

무도챗봇 서비스 설명

 

무도챗봇의 RAG기능

- RAG 기능으로 인해 사용자가 묻는 다양한 질문 이해

- 관련 정보와 예시를 빠르게 제공

 

RAG란?

- RAG(Retrieval-Augmented Generation, Generation, 검색증강생성)

- 외부 지식 베이스(벡터DB)의 내용에 기반해 답변의 정확성과 신뢰성을 높이는 방식

- 방대한 자료를 실시간으로 참고해 질문과 관련된 정보를 정확하고 풍부하게 제공

- 체형 교정이나 필라테스 등 전문 영역에서도 구체적이고 일관된 답변을 받을 수 있음

 

무도챗봇 제작과정

1. LLM 모델 선정

- 헬스케어 특성상 높은 정확도가 필요하기 때문에, 무도챗봇은 고성능 GPT 모델을 채택

- 적용 분야와 목적에 맞는 모델을 선택하는 과정은 서비스 품질을 좌우하는 핵심 요소

2. 데이터 수집 & 임베딩 모델 사용

- 이미지, 텍스트, 자연어 질문 등 다양한 데이터를 수집한 뒤, 필요한 정보 추출

- 이후 임베딩 모델을 활용해 데이터를 벡터형태로 변환하여 검색 및 학습이 가능한 구조로 만듦

3. 벡터 기반 데이터 검색

- 임베딩된 데이터는 벡터 DB에 저장되며, 사용자의 질문도 동일하게 벡터로 변환

- 벡터 DB는 두 벡터의 유사도를 비교해 가장 연관성이 높은 정보를 빠르게 찾아 제공

4. 검색 결과 기반의 답변 생성

- AI는 벡터DB에서 반한된 관련 정보를 조합해, 질문의 의도에 맞는 답변을 생성

- 정확한 데이터 기반 응답을 통해 기존 생성형 AI 할루시네이션 문제를 크게 줄일 수 있음

 

LLM 모델선정 - 높은 정확도의 핵심

- 무도챗봇은 단순한 챗봇이 아니라 문서 기반으로 정확한 답변을 제공하는 RAG 챗봇

- 모델 선정을 위해서는 정확도·안정성·한국어 성능 등을 고려할 수 있음

 

우수한 GPT 계열 모델을 사용하는 무도챗봇

1. 우수한 자연어 이해도

- 복잡한 정책, 방대한 규정·약관을 이해

- 사용자가 쉽게 이해할 수 있도록 자연스럽게 안내

2. 긴 문맥 기반 정교한 답변

- 장문 질의도 맥락을 유지하며, 정확한 정보 추출 및 요약 가능

3. 서버 구축 없이 가능한 운영

- API 기반의 서비스로 인프라 부담을 최소화

4. 낮은 개발 난이도와 빠른 구축

- 별도 모델 학습 없이도 챗봇 개발 및 RAG 연결이 용이

 

데이터 수집 & 전처리

- 고객이 제공하는 문서(PDF, Word, PPT, Excel, HTML)를 자동으로 파싱하여 AI가 이해할 수 있는 “텍스트+메타데이터” 형태로 정리

 

임베딩 모델 선정

- 문서를 AI가 이해하려면 먼저 임베딩(벡터화)이 필요

- 임베딩 모델이 따라 검색 정확도와 답변 품질이 크게 달라지기 때문에, 무도챗봇은 OpenAI, cohere, BGE/E5 3개의 모델 중 LLM모델과 가장 적합한 임베딩 모델을 선택

· GPT와 같은 회사의 엔진 → 의미 해석 호환성 최고

· 한국어/영어 혼합 문서도 문제 없음

· 파싱한 문서를 재정리 없이 바로 벡터화 가능

· GPU 없이 API 호출만으로 처리 → 초기비용 거의 없음

· 검색 정확도(Recall/Precision)가 현재 시점에서 가장 안정적

 

임베딩 처리 과정

- API로 처리하기 때문에 GPU 불필요

- 문서수집 → 텍스트추출 → 청킹 → 메타데이터 부여 → 임베딩 모델 호출 → 벡터DB에 저장

 

전처리 과정 - 데이터 파싱

- 글자 깨짐, 줄바꿈, 공백정리, 표를 텍스트로 변환, 특수문자 등 정리

- 유지관리 방법

·  새 문서가 생기면 주기적 재임베딩(수동/자동)

·  오래된 문서는 아카이빙

·  오래된 문서는 아카이빙

 

벡터 기반 데이터 검색 – 벡터DB 선정

- 문서가 임베딩되면, 이를 저장하고 검색하는 벡터DB가 필요합니다.

- 벡터DB는 챗봇의 보안·속도·운영비를 좌우하기 때문에 무도챗봇은 Weviate, Pinecone, Chroma 솔루션을 비교하여 최적의 구조를 선택

· 고객사 문서 기반 RAG

· 사내용&고객용 Q&A 으로, 로컬/단일 서버로 구현 가능

· 초기비용·운영비 최소화가 핵심

· Python 기반의 가벼운 구조로 (GPT+Open임베딩) 과 조합이 좋음

· 개발난이도가 낮음

· 확장성(문서의 추가/삭제)이 좋음

· 보안·비용·성능을 모두 고려했을 때 최적의 선택

· 데이터가 외부로 업로드되지 않아 보안 우려 없음

 

검색결과 기반의 답변 생성

1. 고품질 검색을 위한 Retrieval 튜닝 : 검색 결과의 정확도를 높이기 위함

- Top-K : 몇 개의 문서를 GPT가 볼 것인지. 지속적인 테스트를 통해 도출해야 함. 기본 3-5개

- Threshold : 유사값(임계값)을 설정해, 유사도(벡터)가 낮으면 관련 문서 없음으로 처리. 

  ex) 유사도 < 0.70 이면 검색결과 표출X, 할루시네이션 방지

- 카테고리의 하위 문서만 검색하도록 설정

 

2. 청킹 품질의 최적화 : 정확한 청킹이 검색+답변의 품질 개선

- 의미 단위로 청킹 : 문단, 섹션, 표, 항목 등

- 300-800자 권장 : 너무 짧으면 정확도가 떨어지고, 길면 정보의 섞임 우려

 

3. 프롬프트 설계

- ‘제공된 문서에 근거해’, ‘해당 정보는 문서에 없습니다’ 등 근거 중심의 답변을 강제하는 방법

- 키워드 검색+벡터 검색 혼용, 키워드 검색은 단순한 검색일 경우 효과적

 

개발일정

- 본 개발은 총 6주간 단계별로 진행. 이는 선정한 모델과 API 사용량(토큰 단위)에 따라 상이 할 수 있음

1. LLM 모델 선정&RAG 아키텍처 설계

- 모델 선정 및 기획 1~3일

- API 사용료(사용량에 따라 상이)

2. 데이터 수집 & 임베딩 모델 사용

- 데이터 수집, 청킹작업 1~2주(문서량에 따라 작업량 상이)

3. 벡터DB선정, 벡터DB화

- 데이터 벡터DB화 작업 약 1주

- DB모델에 따라 세팅 비용 상이

4. 검색 결과 기반 답변 생성

- 챗봇 프로그램 개발 2~3주

 

RAG 기능 챗봇 개발 체크리스트

- 검색 및 정보 인덱싱 능력

- 언어 모델 활용 능력

- 시스템 통합 및 파이프라인 설계 능력

 

사용방법

1. 질문하기

- 거북목, 라운드숄더, 굽은등, 척추측만증처럼 불편한 부위가 있다면 자유롭게 질문하세요.

- 증상 설명이나 간단한 키워드만으로도 바로 관련 정보를 안내받을 수 있습니다.

2. 검색 결과

- RAG 기능을 활용하여 외부 문서, 논문, 가이드 자료 등 방대한 정보를 자동으로 검색하고 분석합니다

- 그 과정에서 가장 신뢰도 높고 관련성 있는 자료를 선별하여, 정확하고 체계적인 답변을 받을 수 있습니다.

3. 정보활용

- 검색 결과에서 제공되는 동영상·이미지·논문·가이드 자료를 통해 자세 교정에 필요한 내용을 더 깊이 있게 확인하고 바로 활용할 수 있습니다.

 

분야별 RAG기능 활용 사례

1. 체육관

- 체육관에서 챗봇 활용은 운동 루틴 안내, 기구 사용법 설명, 근력·유산소 프로그램 추천 등 기능이 있습니다.

- 특히, 초보자와 회원 개별 수준에 맞춰 효율적인 운동 계획을 안내할 수 있습니다.

· 회원 개별 수준에 맞는 여러 동작을 추천 받기

· 사용자의 질문을 이해하고 정확한 답변 도출(RAG기능)

· 검색어 예시를 이용하여 검색 효율 향상 시킴

2. 필라테스

- 필라테스에서 챗봇 활용은 동작 가이드 제공, 스트레칭 추천, 코어 강화 프로그램 안내 등 기능이 있습니다.

- 회원 목표와 체형 특성에 맞춰 안전하게 자세를 개선하는 방법을 안내할 수 있습니다.

3. 교정센터

- 자세교정센터에서 챗봇 활용은 체형 분석, 맞춤 운동 안내 등 기능이 있습니다.

- 거북목, 골반 틀어짐, 척추 불균형 등 문제 유형에 맞춘 교정법을 신속하게 안내할 수 있습니다.

· RAG기능으로 기존 생성형 AI가 가진 환각 문제를 크게 줄이고, 헬스케어 분야에 적합한 신뢰도 높은 응답 제공

 

무도챗봇 사용자 화면

1. 빠른 검색 예시 버튼

- 메인 화면은 채팅에 중점을 두며 사이드바에 어떤 질문을 가장 많이 하였는지 질문 또는 예시들을 통해 빠르게 질문할 수 있도록 합니다.

2. 질문 랭킹 탭

- 질문 랭킹은 사용자들이 자주 묻는 주제를 RAG가 우선적으로 참고할 수 있게 만들어 더 많은 데이터가 축적된 영역에서 더욱 정확하고 정교한 답변을 제공할 수 있게 해줍니다.

3. 질문 화면

- RAG 기반 질문화면에서는 사용자가 입력한 키워드를 외부 지식과 연결해 분석하고, 그 중 가장 신뢰도 높은 정보를 골라 최적의 답변으로 제공합니다.​