Notice
Recent Posts
Recent Comments
Link
반응형
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- toolnode
- update_state
- rl
- 강화학습
- langgrpah
- subgraph
- removemessage
- 강화학습의 수학적 기초와 알고리듬의 이해
- 추천시스템
- summarize_chat_history
- langgraph
- rag
- tool_binding
- chat_history
- human-in-the-loop
- add_subgraph
- 밑바닥부터시작하는딥러닝 #딥러닝 #머신러닝 #신경망
- pinecone
- lcel
- conditional_edge
- 강화학습의 수학적 기초와 알고리듬 이해
- Ai
- humannode
- REACT
- Python
- tool_calls
- RecSys
- 밑바닥부터 시작하는 딥러닝
- conditional_edges
- LangChain
Archives
- Today
- Total
반응형
목록summarize_chat_history (1)
반응형
타임트리
[LangGraph] 과거 대화 이력의 요약
대화 기록 요약 추가멀티턴을 위해 대화 기록을 저장해두고, 모델 호출 시 프롬프트에 삽입하는 것은 채팅 관련 서비스에서 필수적인 기능 중 하나이다. 하지만 대화가 길어질수록 여러 제약이 따르는데, 예를 들면 Context length를 초과하게 되거나, Input token의 증가로 호출 비용이 증가하는 등의 문제가 있다. 그래서 일반적으로 대화 기록을 효과적으로 관리하는 방법을 사용한다.대표적으로 아래와 같은 방법들들이 있다.Vector DB Integration: 대화 이력을 임베딩 벡터로 저장하고, 유사도 검색으로 관련 대화 가져오는 방법. 맥락 검색 정확도가 높으나, 임베딩/검색 과정에서 추가 리소스 필요Sliding Window: 최근 K개의 대화를 저장해 최신 대화에 집중 가능하나, 과거 맥락..
LLM/LangGraph
2025. 1. 1. 04:13