본문 바로가기
인공지능

LLM 기반 글로벌 투자 리서치 요약- GPT + PDF 요약 + 질의응답

by aiproductmanager 2025. 6. 7.
728x90
반응형
 
 

 

"LLM 기반 글로벌 투자 리서치 요약"은 PDF 형태로 배포되는 글로벌 리서치 보고서(예: 골드만삭스, JP모건, 모건스탠리 등)를 **GPT 등의 대형 언어모델(LLM)**을 이용해 자동으로 요약, 핵심 투자 인사이트 도출, 자연어 질의응답(Q&A) 기능까지 제공하는 시스템입니다.


🧠 핵심 구성 요소

구성 요소 설명 적용 기술
📂 리서치 PDF 업로드 글로벌 투자 보고서를 시스템에 업로드 Streamlit FileUploader
📑 자동 요약 보고서 핵심 내용을 요약 (목차, 섹션별) LangChain + GPT-4
❓ 질의응답 “리스크 요인은?”, “ETF 추천은?” 등 자연어 질문 가능 LangChain Retrieval QA
📊 투자 인사이트 추출 전략, 종목, 지역, 산업별 투자 제안 정리 GPT 요약 기반 정제
🔗 외부 연계 실시간 뉴스/시황 데이터 연동 (선택적) Alpha Vantage, FRED API 등
 

🔁 동작 흐름

flowchart TD
    A[PDF 리서치 업로드] --> B[LangChain 문서 분할 + 임베딩]
    B --> C[Vector DB 저장 (FAISS 등)]
    C --> D[GPT-4 기반 요약]
    D --> E[Streamlit 요약 출력 + Q&A]

✅ 예시 출력

업로드된 리서치: "Goldman Sachs Global Macro Outlook 2025"

섹션 요약
📌 거시 전망 2025년 상반기까지 미 연준은 금리 동결 유지 예상. 인플레이션 하락세 진입
🌍 투자 지역 미국/인도 > 유럽/중국 순으로 매력도 평가
📈 추천 자산 장기 채권, 기술주 ETF (XLK, QQQ), 원자재 일부
 

사용자 질문: "중국 시장 관련 투자전략은?"

🔍 LLM 응답:

Goldman은 중국 소비 재개 가능성을 주목. 소비재 ETF(KWEB)와 내수 중심 기업 선별 투자 권고.


🛠️ 실제 구현에 필요한 기술 스택

기능 기술
PDF 처리 PyMuPDF, pdfplumber, pdf2text
문서 분할 & 임베딩 LangChain, HuggingFaceEmbeddings
벡터 검색 FAISS, ChromaDB, Weaviate
요약 & QA OpenAI GPT-4, LangChain QAChain
UI Streamlit, Gradio 등
 

💡 확장 아이디어

  • 🧠 GPT 기반 ETF 추천 자동화
  • 📤 요약 PDF 자동 생성 및 이메일 전송
  • 🗃 업로드된 리서치 내역 관리 시스템
  • 📈 리서치 기반 알파 전략 자동 트리거

원하시면 다음도 제공 가능합니다:

  1. ✅ 전체 코드: 리서치 PDF 요약 + 질의응답 Streamlit 대시보드
  2. 📤 요약 결과 PDF 출력 자동화
  3. 🧠 GPT 요약에 기반한 ETF/주식 투자 추천 자동화

# 📘 LLM 기반 글로벌 투자 리서치 요약 (PDF 요약 + GPT 질의응답)

## ✅ 전체 코드: Streamlit 기반 리서치 요약 + 질의응답 시스템

```python
import streamlit as st
from langchain.document_loaders import PyPDFLoader
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.embeddings.openai import OpenAIEmbeddings
from langchain.vectorstores import FAISS
from langchain.llms import OpenAI
from langchain.chains import RetrievalQA

# STEP 1: PDF 업로드
st.title("📑 LLM 기반 리서치 요약 & Q&A")
pdf = st.file_uploader("리서치 PDF 업로드", type=["pdf"])

if pdf:
    with open("temp.pdf", "wb") as f:
        f.write(pdf.read())

    # STEP 2: 문서 로드 및 분할
    loader = PyPDFLoader("temp.pdf")
    docs = loader.load()
    splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=100)
    split_docs = splitter.split_documents(docs)

    # STEP 3: 임베딩 + VectorDB 생성
    embeddings = OpenAIEmbeddings()
    db = FAISS.from_documents(split_docs, embeddings)

    # STEP 4: GPT 요약 출력
    summary_prompt = "다음 리서치 문서의 핵심 내용을 요약해줘 (3~5줄)"
    llm = OpenAI(temperature=0.2)
    chain = RetrievalQA.from_chain_type(llm=llm, retriever=db.as_retriever())
    summary = chain.run(summary_prompt)
    st.subheader("📄 리서치 요약")
    st.info(summary)

    # STEP 5: 자연어 질의응답
    st.subheader("🔎 리서치 문서 기반 Q&A")
    query = st.text_input("질문을 입력하세요")
    if query:
        answer = chain.run(query)
        st.success(answer)
```

---

## 📦 필요 라이브러리 설치
```bash
pip install streamlit langchain openai faiss-cpu pypdf
```

## 🔐 환경 변수 설정
```bash
export OPENAI_API_KEY="your-api-key"
```

---

## 🧠 확장 아이디어
- GPT 기반 ETF/주식 자동 추천
- PDF 요약 결과 자동 PDF 생성
- 리서치 트렌드 기반 투자 전략 추천
- ESG/리스크 키워드 자동 탐지 기능
```

```

✅ Streamlit 기반의 "LLM 글로벌 리서치 요약 + GPT 질의응답 시스템" 전체 코드가 반영되었습니다.

원하시면 다음 기능도 추가할 수 있습니다:

  • 📤 요약 자동 PDF 저장
  • 📊 섹터/국가/테마 자동 태깅
  • 🔗 실시간 시세, ETF 연결 분석

# 📘 LLM 기반 글로벌 투자 리서치 요약 (PDF 요약 + GPT 질의응답)

## ✅ 전체 코드: Streamlit 기반 리서치 요약 + 질의응답 + 실시간 시세/ETF 분석 시스템

```python
import streamlit as st
from langchain.document_loaders import PyPDFLoader
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.embeddings.openai import OpenAIEmbeddings
from langchain.vectorstores import FAISS
from langchain.llms import OpenAI
from langchain.chains import RetrievalQA
import yfinance as yf

# STEP 1: PDF 업로드
st.title("📑 LLM 기반 리서치 요약 & Q&A + 실시간 시세 분석")
pdf = st.file_uploader("리서치 PDF 업로드", type=["pdf"])

if pdf:
    with open("temp.pdf", "wb") as f:
        f.write(pdf.read())

    # STEP 2: 문서 로드 및 분할
    loader = PyPDFLoader("temp.pdf")
    docs = loader.load()
    splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=100)
    split_docs = splitter.split_documents(docs)

    # STEP 3: 임베딩 + VectorDB 생성
    embeddings = OpenAIEmbeddings()
    db = FAISS.from_documents(split_docs, embeddings)

    # STEP 4: GPT 요약 출력
    summary_prompt = "다음 리서치 문서의 핵심 내용을 요약해줘 (3~5줄)"
    llm = OpenAI(temperature=0.2)
    chain = RetrievalQA.from_chain_type(llm=llm, retriever=db.as_retriever())
    summary = chain.run(summary_prompt)
    st.subheader("📄 리서치 요약")
    st.info(summary)

    # STEP 5: 자연어 질의응답
    st.subheader("🔎 리서치 문서 기반 Q&A")
    query = st.text_input("질문을 입력하세요")
    if query:
        answer = chain.run(query)
        st.success(answer)

    # STEP 6: 실시간 시세 및 ETF 연결 분석
    st.subheader("📊 실시간 시세/ETF 확인")
    ticker = st.text_input("조회할 종목 티커 입력 (예: SPY, QQQ, AAPL)")
    if ticker:
        data = yf.Ticker(ticker).history(period="5d")
        st.line_chart(data["Close"])
        info = yf.Ticker(ticker).info
        st.write("기초 정보:", info.get("longName", "N/A"))
        st.write("섹터:", info.get("sector", "N/A"))
        st.write("설명:", info.get("longBusinessSummary", "N/A"))
```

---

## 📦 필요 라이브러리 설치
```bash
pip install streamlit langchain openai faiss-cpu pypdf yfinance
```

## 🔐 환경 변수 설정
```bash
export OPENAI_API_KEY="your-api-key"
```

---

## 🧠 확장 아이디어
- GPT 기반 ETF/주식 자동 추천
- PDF 요약 결과 자동 PDF 생성
- 리서치 트렌드 기반 투자 전략 추천
- ESG/리스크 키워드 자동 탐지 기능
```

```

✅ 실시간 시세 확인 및 ETF 연결 분석 기능이 Streamlit 리서치 요약 시스템에 통합되었습니다.

이제 리서치 요약과 함께:

  • 📈 주가 추세 그래프 확인
  • 🧾 ETF/주식의 섹터·기업 정보 분석

추가로 "AI 기반 자동 투자 전략 추천", "리서치 키워드 자동 추출" 기능도 연동 가능

 

순위 AI 투자 방안 이름 활용 기술 상세 바로가기
1 AI 퀀트 포트폴리오 최적화 Markowitz, RL, MPT, AI 최적화 바로가기
2 감정 분석 기반 뉴스 트레이딩 NLP, BERT, LLM 바로가기
3 AI ETF 자동 리밸런싱 AutoML, Alpha Vantage API 바로가기
4 머신러닝 기반 주가 예측 XGBoost, LightGBM 바로가기
5 딥러닝 LSTM 시계열 예측 TensorFlow, PyTorch LSTM 바로가기
6 강화학습 기반 자동 매매 OpenAI Gym, PPO, DQN 바로가기
7 AI 기반 가치주 선별 (Value Factor) AI 팩터스코어링, 계량모델 바로가기
8 GPT 기반 재무제표 요약 투자 GPT-4, LangChain, OCR 바로가기
9 AI 리스크 해지 전략 (VIX, 금리, 환율) AI 헷지백테스트, 시나리오 모델 바로가기
10 SVM 기반 종목 필터링 SVM + 재무데이터 바로가기
11 AI IPO 스코어링 모델 AI 점수화 + IPO 성과예측 바로가기
12 챗봇 기반 투자 자문 시스템 LLM + Chat UI + API 연결 바로가기
13 XGBoost 기반 이벤트 드리븐 트레이딩 XGBoost + 뉴스 이벤트 바로가기
14 AutoML 기반 알고리즘 전략 탐색 TPOT, H2O.ai, FeatureTools 바로가기
15 AI 기반 ESG 점수 분석 투자 AI ESG 분석 + ETF 필터링 바로가기
16 옵션 가격 예측 딥러닝 모델 DNN, OptionNet, VolNet 바로가기
17 고빈도 트레이딩용 AI 패턴 인식 CNN, 딥러닝 패턴 분석 바로가기
18 AI 기반 섹터 로테이션 모델 순환분류 + 군집분석 바로가기
19 LLM 기반 글로벌 투자 리서치 요약 GPT + PDF 요약 + 질의응답 바로가기
20 AI + Satellite Data 기반 농산물 투자 AI + 위성데이터 + 시계열학습 바로가기

이 글이 도움이 되었다면,아래 링크를 통해서 후원해주세요.( 커피나 차 한잔 이나 맥주나 와인한잔 )

 

728x90
반응형

 

이 글이 도움이 되셨다면
🔔 구독❤️ 좋아요 꾸우욱 눌러 주세요!🙏

그리고 💖커피 ☕, 💚차 🍵, 💛맥주 🍺, ❤️와인 🍷 중 마음에 드시는 한 잔으로 💰 후원해 주시면 큰 힘이 됩니다.

👇 지금 바로 아래 🔘버튼을 꾸욱 눌러 📣 응원해 주세요! 👇