Google I/O 2025,인공지능(AI), 확장현실(XR), 스마트 글라스

인공지능

망고노트 2025. 9. 11. 07:20

728x90

2025년 5월 20일 개최된 Google I/O 2025에서는 인공지능(AI), 확장현실(XR), 스마트 글라스 등 다양한 분야에서 혁신적인 기술과 제품이 발표되었습니다. 주요 내용을 요약하면 다음과 같습니다:Google Developers Blog+1

🌟 주요 발표 내용 요약

Google의 차세대 AI 모델인 Gemini 2.5 Pro와 Flash가 공개되었습니다.
특히, Deep Think 모드는 복잡한 문제 해결과 고급 추론 능력을 강화하여 코딩, 창작, 분석 작업에서 뛰어난 성능을 발휘합니다. blog.google+6위키백과+6LOS40+6The Verge+3LOS40+3위키백과+3

AI 모드를 통해 Google 검색이 대화형 챗봇 형태로 진화하였습니다.
이 기능은 Gemini 2.5를 기반으로 하며, 사용자에게 더 개인화된 검색 결과와 실시간 번역, AR 기반 쇼핑 시뮬레이션 등을 제공합니다. TechCrunch+7The Times of India+7The Verge+7

Google은 Gentle Monster 및 Warby Parker와 협력하여 Android XR 플랫폼 기반의 스마트 글라스를 선보였습니다.
이 안경은 카메라, 마이크, 스피커, 렌즈 내 디스플레이를 탑재하여 메시지 전송, 길찾기, 실시간 언어 번역 등의 기능을 지원합니다. Tom's Guide+1

Gemini Live는 카메라, 음성, 웹 데이터를 통합하여 실시간으로 지능적인 작업을 수행하는 기능입니다.
Project Astra는 시각적 상호작용에 실시간으로 반응하는 AI 어시스턴트로, 사용자의 일상적인 작업을 자동화합니다. WIRED+1

Imagen 4: 텍스트에서 고해상도 이미지를 생성하는 도구로, 세밀한 디테일과 텍스처 표현이 강화되었습니다.
Veo 3: AI를 활용하여 현실적인 비디오와 오디오를 생성하는 도구입니다.
Flow: 사용자가 직접 장면을 선택하고 음악을 추가하여 AI 기반의 비디오를 제작할 수 있는 도구입니다. WIRED+3WIRED+3Tom's Guide+3Tom's GuideTechRadar+1

Google Beam은 3D 비디오 통화를 지원하는 새로운 플랫폼으로, 몰입감 있는 커뮤니케이션을 제공합니다. The Times of India+2The Verge+2

Google은 새로운 AI 구독 서비스인 AI Pro($20/월)와 AI Ultra($250/월)를 출시하여, 다양한 수준의 AI 기능을 제공합니다. The Times of India+3WIRED+3Tom's Guide+3

더 자세한 내용을 원하신다면, 아래의 공식 발표 영상을 참고하시기 바랍니다:

2025년 Google I/O 발표 내용과 OpenAI의 최근 발표 내용을 주요 기술, 제품, 전략 중심으로 비교한 표는 아래와 같습니다:

항목	Google I/O 2025	OpenAI (2024-2025)
최신 모델	Gemini 2.5 Pro, Gemini Flash	GPT-4o (Omni)
주요 특징	Deep Think, 실시간 멀티모달(텍스트+영상+음성)	멀티모달 처리, 실시간 반응, 음성 인터럽트, 감정 표현 가능
생성 AI 기능	Imagen 4 (이미지), Veo 3 (영상), Flow (영상 편집)	DALL·E 3 (이미지 생성/편집), Whisper (음성 인식), Sora (영상 생성)
XR/스마트 글라스	Android XR 기반, Gentle Monster/Warby Parker 협업	미공개 (하드웨어는 없음)
AI 비서	Gemini Live, Project Astra (실시간 카메라/음성 연동)	ChatGPT GPT-4o (실시간 대화 + 시각정보 응답 가능)
사용자 인터페이스	Android 통합, Pixel/스마트글라스/웹 등 다양한 플랫폼	ChatGPT 앱, 웹, 데스크톱 앱 (멀티모달 직접 사용 가능)
유료 서비스	AI Pro ($20/월), AI Ultra ($250/월)	ChatGPT Plus ($20/월), Team/Enterprise 요금제
생태계 전략	Android + Gemini 통합 확장 / OEM 파트너들과 XR 구축	API 제공 + 앱 생태계 확장 (앱스토어 및 사용자 맞춤 GPT)

OpenAI는 소프트웨어 중심의 AI 혁신에 집중하고 있으며, GPT-4o로 멀티모달의 정점을 찍음.
Google은 Gemini 2.5를 중심으로 **하드웨어(XR 글라스)**까지 포함한 플랫폼 확장 전략을 추진 중.
콘텐츠 생성 AI는 Google(Veo/Imagen)이 더 다양한 도구군을 소개한 반면, OpenAI는 더 높은 품질의 텍스트 중심 기능에 강점.
AI 비서 경쟁은 Google의 Astra와 OpenAI의 ChatGPT-4o 간 실시간 상호작용(AI + 카메라/음성) 분야에서 본격 경쟁 중.

아래는 기능별 세부 항목에 따른 Google I/O 2025 vs OpenAI (GPT-4o) 비교입니다.

기능	Google Gemini 2.5	OpenAI GPT-4o
텍스트 이해	고도화된 추론 기능 (Deep Think)	고속 응답 + 다중 문맥 이해
음성 인식 및 응답	Gemini Live – 실시간 대화 지원 (음성 명령 및 응답)	Whisper + 실시간 반응, 감정 표현, 인터럽트 가능
이미지 인식	Astra – 실시간 카메라 기반 시각 정보 이해	이미지 분석 + 질문 응답 가능 (업로드 기반)
영상 이해	Veo 3 제작, 시연 수준에서 활용 가능	Sora 영상 생성 (이해는 아직 제한적)
카메라 연동 실시간 반응	Project Astra (카메라가 보는 상황을 인지하고 대응)	GPT-4o는 카메라 기능 없음 (이미지 업로드만 지원)

728x90