본문 바로가기

rag2

RAG vs 롱컨텍스트 (토큰효율, 의사결정, 프롬프트패턴) RAG가 무조건 정답이라고 믿어왔다면, 한 번쯤 의심해볼 필요가 있습니다. 250페이지 보고서 12건과 인터뷰 전사 80건을 직접 다뤄본 뒤, 저는 그 믿음을 조금 내려놓았습니다. 어떤 상황에서 무엇을 선택해야 하는지, 실제 수치와 함께 풀어봅니다.토큰효율: 한국어 환경에서 1M 컨텍스트는 얼마나 실용적인가RAG(Retrieval-Augmented Generation)는 쉽게 말해 질문과 관련 있는 텍스트 조각만 뽑아 모델에게 전달하는 방식입니다. 즉, 수백만 토큰짜리 문서 전체를 모델에 넣는 대신, 필요한 부분만 꺼내 쓰는 검색 우선 구조입니다. 비용이 낮고 응답 속도가 빠르다는 장점 때문에 오랫동안 표준처럼 여겨져 왔습니다.그런데 Gemini 1.5 Pro가 최대 1M 토큰의 컨텍스트 윈도우를 지원하.. 2026. 6. 9.

RAG UX 설계 (출처 신뢰도, 한국어 패턴, 실전 적용) 출처 표시 하나만 바꿨는데 NPS가 4점에서 8점으로 두 배 뛰었습니다. 제가 직접 겪은 일입니다. 사내 위키 검색 외주에서 LLM 답변을 출처 없이 결과만 내보냈을 때 사용자 신뢰도가 바닥이었는데, RAG 응답 컴포넌트에 출처 표시를 붙인 것만으로 점수가 완전히 달라졌습니다. 기술 완성도보다 신뢰 설계가 먼저라는 걸 그때 뼈저리게 배웠습니다.출처 신뢰도: RAG가 신뢰받는 구조가 따로 있습니다RAG(Retrieval-Augmented Generation)란 LLM이 답변을 생성할 때 외부 데이터를 실시간으로 끌어와 사실에 가깝게 만드는 방식입니다. 쉽게 말해, 모델이 기억만으로 대답하는 게 아니라 문서나 웹 검색 결과를 먼저 찾아보고 그걸 근거로 답하는 구조입니다.여기서 핵심이 하나 있습니다. 기술적으.. 2026. 5. 15.

이전 1 다음

소개 및 문의 · 개인정보처리방침 · 면책조항

© 2026 브레인스토밍 연구

티스토리툴바