인공지능
Google I/O 2025,인공지능(AI), 확장현실(XR), 스마트 글라스
망고노트
2025. 9. 11. 07:20
728x90
반응형

2025년 5월 20일 개최된 Google I/O 2025에서는 인공지능(AI), 확장현실(XR), 스마트 글라스 등 다양한 분야에서 혁신적인 기술과 제품이 발표되었습니다. 주요 내용을 요약하면 다음과 같습니다:Google Developers Blog+1
🌟 주요 발표 내용 요약
1. Gemini 2.5 및 Deep Think
- Google의 차세대 AI 모델인 Gemini 2.5 Pro와 Flash가 공개되었습니다.
- 특히, Deep Think 모드는 복잡한 문제 해결과 고급 추론 능력을 강화하여 코딩, 창작, 분석 작업에서 뛰어난 성능을 발휘합니다. blog.google+6위키백과+6LOS40+6The Verge+3LOS40+3위키백과+3
2. AI 모드가 적용된 새로운 Google 검색
- AI 모드를 통해 Google 검색이 대화형 챗봇 형태로 진화하였습니다.
- 이 기능은 Gemini 2.5를 기반으로 하며, 사용자에게 더 개인화된 검색 결과와 실시간 번역, AR 기반 쇼핑 시뮬레이션 등을 제공합니다. TechCrunch+7The Times of India+7The Verge+7
3. Android XR 및 스마트 글라스
- Google은 Gentle Monster 및 Warby Parker와 협력하여 Android XR 플랫폼 기반의 스마트 글라스를 선보였습니다.
- 이 안경은 카메라, 마이크, 스피커, 렌즈 내 디스플레이를 탑재하여 메시지 전송, 길찾기, 실시간 언어 번역 등의 기능을 지원합니다. Tom's Guide+1
4. Gemini Live와 Project Astra
- Gemini Live는 카메라, 음성, 웹 데이터를 통합하여 실시간으로 지능적인 작업을 수행하는 기능입니다.
- Project Astra는 시각적 상호작용에 실시간으로 반응하는 AI 어시스턴트로, 사용자의 일상적인 작업을 자동화합니다. WIRED+1
5. AI 기반 콘텐츠 생성 도구
- Imagen 4: 텍스트에서 고해상도 이미지를 생성하는 도구로, 세밀한 디테일과 텍스처 표현이 강화되었습니다.
- Veo 3: AI를 활용하여 현실적인 비디오와 오디오를 생성하는 도구입니다.
- Flow: 사용자가 직접 장면을 선택하고 음악을 추가하여 AI 기반의 비디오를 제작할 수 있는 도구입니다. WIRED+3WIRED+3Tom's Guide+3Tom's GuideTechRadar+1
6. Google Beam
- Google Beam은 3D 비디오 통화를 지원하는 새로운 플랫폼으로, 몰입감 있는 커뮤니케이션을 제공합니다. The Times of India+2The Verge+2
7. AI 구독 서비스
- Google은 새로운 AI 구독 서비스인 AI Pro($20/월)와 AI Ultra($250/월)를 출시하여, 다양한 수준의 AI 기능을 제공합니다. The Times of India+3WIRED+3Tom's Guide+3
📺 공식 발표 영상
더 자세한 내용을 원하신다면, 아래의 공식 발표 영상을 참고하시기 바랍니다:
2025년 Google I/O 발표 내용과 OpenAI의 최근 발표 내용을 주요 기술, 제품, 전략 중심으로 비교한 표는 아래와 같습니다:
| 항목 | Google I/O 2025 | OpenAI (2024-2025) |
|---|---|---|
| 최신 모델 | Gemini 2.5 Pro, Gemini Flash | GPT-4o (Omni) |
| 주요 특징 | Deep Think, 실시간 멀티모달(텍스트+영상+음성) | 멀티모달 처리, 실시간 반응, 음성 인터럽트, 감정 표현 가능 |
| 생성 AI 기능 | Imagen 4 (이미지), Veo 3 (영상), Flow (영상 편집) | DALL·E 3 (이미지 생성/편집), Whisper (음성 인식), Sora (영상 생성) |
| XR/스마트 글라스 | Android XR 기반, Gentle Monster/Warby Parker 협업 | 미공개 (하드웨어는 없음) |
| AI 비서 | Gemini Live, Project Astra (실시간 카메라/음성 연동) | ChatGPT GPT-4o (실시간 대화 + 시각정보 응답 가능) |
| 사용자 인터페이스 | Android 통합, Pixel/스마트글라스/웹 등 다양한 플랫폼 | ChatGPT 앱, 웹, 데스크톱 앱 (멀티모달 직접 사용 가능) |
| 유료 서비스 | AI Pro ($20/월), AI Ultra ($250/월) | ChatGPT Plus ($20/월), Team/Enterprise 요금제 |
| 생태계 전략 | Android + Gemini 통합 확장 / OEM 파트너들과 XR 구축 | API 제공 + 앱 생태계 확장 (앱스토어 및 사용자 맞춤 GPT) |
주요 비교 요약
- OpenAI는 소프트웨어 중심의 AI 혁신에 집중하고 있으며, GPT-4o로 멀티모달의 정점을 찍음.
- Google은 Gemini 2.5를 중심으로 **하드웨어(XR 글라스)**까지 포함한 플랫폼 확장 전략을 추진 중.
- 콘텐츠 생성 AI는 Google(Veo/Imagen)이 더 다양한 도구군을 소개한 반면, OpenAI는 더 높은 품질의 텍스트 중심 기능에 강점.
- AI 비서 경쟁은 Google의 Astra와 OpenAI의 ChatGPT-4o 간 실시간 상호작용(AI + 카메라/음성) 분야에서 본격 경쟁 중.
아래는 기능별 세부 항목에 따른 Google I/O 2025 vs OpenAI (GPT-4o) 비교입니다.
1. 대화형 AI (멀티모달 능력)
| 기능 | Google Gemini 2.5 | OpenAI GPT-4o |
| 텍스트 이해 | 고도화된 추론 기능 (Deep Think) | 고속 응답 + 다중 문맥 이해 |
| 음성 인식 및 응답 | Gemini Live – 실시간 대화 지원 (음성 명령 및 응답) | Whisper + 실시간 반응, 감정 표현, 인터럽트 가능 |
| 이미지 인식 | Astra – 실시간 카메라 기반 시각 정보 이해 | 이미지 분석 + 질문 응답 가능 (업로드 기반) |
| 영상 이해 | Veo 3 제작, 시연 수준에서 활용 가능 | Sora 영상 생성 (이해는 아직 제한적) |
| 카메라 연동 실시간 반응 | Project Astra (카메라가 보는 상황을 인지하고 대응) | GPT-4o는 카메라 기능 없음 (이미지 업로드만 지원) |
2. 콘텐츠 생성 도구 (Create AI)
| 항목 | Google I/O 2025 | OpenAI (2024-2025) |
|---|---|---|
| 이미지 생성 | Imagen 4 (고해상도 표현, 배경·디테일 탁월) | DALL·E 3 (리얼한 스타일, 이미지 편집도 가능) |
| 영상 생성 | Veo 3 (짧은 영화 수준의 영상 생성) | Sora (현실적인 장면 생성, 공개 준비 중) |
| 음악/음성 | 아직 없음 | Suno (제휴), TTS 음성 더빙 지원 |
| 영상 편집/합성 | Flow (사용자 편집형 영상 생성기) | 없음 (현재는 타 플랫폼 연계 필요) |
3. 스마트 디바이스 연동
| 항목 | Google I/O 2025 | OpenAI (2024-2025) |
|---|---|---|
| 스마트 글라스 | Android XR + Gentle Monster 협업 | 없음 |
| AR 연동 | Android 기반 XR 확장 (실시간 맵, 카메라 연동) | 미제공 |
| 플랫폼 통합 | Android 전반과 완전 통합 | 독립형 웹/앱 서비스 |
4. 사용 및 구독 모델
| 항목 | Google I/O 2025 | OpenAI (2024-2025) |
|---|---|---|
| 무료 이용 범위 | 일부 Gemini 기능, 검색과 통합된 AI | GPT-3.5 (무료), 제한적 GPT-4o 체험 |
| 유료 요금제 | AI Pro ($20/월), AI Ultra ($250/월) | Plus ($20/월), Team, Enterprise 등 |
| 맞춤형 기능 | 없음 | 맞춤 GPT, GPT Store 제공 |
| API 제공 | 일부 Android XR SDK 예정 | OpenAI API 완전 공개, 개발자 확장성 뛰어남 |
총평 요약
| 항목 | Google I/O 2025 | OpenAI (2024-2025) |
|---|---|---|
| 강점 | XR 디바이스 통합, 실시간 반응형 비서 | 자연스러운 대화, 고정밀 이미지/음성 처리 |
| 약점 | 독립형 서비스 적음, 영상 편집은 초기 단계 | 하드웨어 없음, 실시간 카메라 정보 수신 불가 |
| 전략 방향 | Android 생태계 중심의 실생활 융합 | 범용 AI 도구 플랫폼 + API 생태계 확대 |
728x90
반응형