Gemini 1.5 pro1 RAG vs 롱컨텍스트 (토큰효율, 의사결정, 프롬프트패턴) RAG가 무조건 정답이라고 믿어왔다면, 한 번쯤 의심해볼 필요가 있습니다. 250페이지 보고서 12건과 인터뷰 전사 80건을 직접 다뤄본 뒤, 저는 그 믿음을 조금 내려놓았습니다. 어떤 상황에서 무엇을 선택해야 하는지, 실제 수치와 함께 풀어봅니다.토큰효율: 한국어 환경에서 1M 컨텍스트는 얼마나 실용적인가RAG(Retrieval-Augmented Generation)는 쉽게 말해 질문과 관련 있는 텍스트 조각만 뽑아 모델에게 전달하는 방식입니다. 즉, 수백만 토큰짜리 문서 전체를 모델에 넣는 대신, 필요한 부분만 꺼내 쓰는 검색 우선 구조입니다. 비용이 낮고 응답 속도가 빠르다는 장점 때문에 오랫동안 표준처럼 여겨져 왔습니다.그런데 Gemini 1.5 Pro가 최대 1M 토큰의 컨텍스트 윈도우를 지원하.. 2026. 6. 9. 이전 1 다음