인공지능

Google I/O 2025,인공지능(AI), 확장현실(XR), 스마트 글라스

망고노트 2025. 9. 11. 07:20
728x90
반응형

 

2025년 5월 20일 개최된 Google I/O 2025에서는 인공지능(AI), 확장현실(XR), 스마트 글라스 등 다양한 분야에서 혁신적인 기술과 제품이 발표되었습니다. 주요 내용을 요약하면 다음과 같습니다:Google Developers Blog+1


🌟 주요 발표 내용 요약

1. Gemini 2.5 및 Deep Think

2. AI 모드가 적용된 새로운 Google 검색

  • AI 모드를 통해 Google 검색이 대화형 챗봇 형태로 진화하였습니다.
  • 이 기능은 Gemini 2.5를 기반으로 하며, 사용자에게 더 개인화된 검색 결과와 실시간 번역, AR 기반 쇼핑 시뮬레이션 등을 제공합니다. TechCrunch+7The Times of India+7The Verge+7

3. Android XR 및 스마트 글라스

  • Google은 Gentle MonsterWarby Parker와 협력하여 Android XR 플랫폼 기반의 스마트 글라스를 선보였습니다.
  • 이 안경은 카메라, 마이크, 스피커, 렌즈 내 디스플레이를 탑재하여 메시지 전송, 길찾기, 실시간 언어 번역 등의 기능을 지원합니다. Tom's Guide+1

4. Gemini Live와 Project Astra

  • Gemini Live는 카메라, 음성, 웹 데이터를 통합하여 실시간으로 지능적인 작업을 수행하는 기능입니다.
  • Project Astra는 시각적 상호작용에 실시간으로 반응하는 AI 어시스턴트로, 사용자의 일상적인 작업을 자동화합니다. WIRED+1

5. AI 기반 콘텐츠 생성 도구

  • Imagen 4: 텍스트에서 고해상도 이미지를 생성하는 도구로, 세밀한 디테일과 텍스처 표현이 강화되었습니다.
  • Veo 3: AI를 활용하여 현실적인 비디오와 오디오를 생성하는 도구입니다.
  • Flow: 사용자가 직접 장면을 선택하고 음악을 추가하여 AI 기반의 비디오를 제작할 수 있는 도구입니다. WIRED+3WIRED+3Tom's Guide+3Tom's GuideTechRadar+1

6. Google Beam

  • Google Beam은 3D 비디오 통화를 지원하는 새로운 플랫폼으로, 몰입감 있는 커뮤니케이션을 제공합니다. The Times of India+2The Verge+2

7. AI 구독 서비스


📺 공식 발표 영상

더 자세한 내용을 원하신다면, 아래의 공식 발표 영상을 참고하시기 바랍니다:

 

 

2025년 Google I/O 발표 내용과 OpenAI의 최근 발표 내용을 주요 기술, 제품, 전략 중심으로 비교한 표는 아래와 같습니다:

항목 Google I/O 2025 OpenAI (2024-2025)
최신 모델 Gemini 2.5 Pro, Gemini Flash GPT-4o (Omni)
주요 특징 Deep Think, 실시간 멀티모달(텍스트+영상+음성) 멀티모달 처리, 실시간 반응, 음성 인터럽트, 감정 표현 가능
생성 AI 기능 Imagen 4 (이미지), Veo 3 (영상), Flow (영상 편집) DALL·E 3 (이미지 생성/편집), Whisper (음성 인식), Sora (영상 생성)
XR/스마트 글라스 Android XR 기반, Gentle Monster/Warby Parker 협업 미공개 (하드웨어는 없음)
AI 비서 Gemini Live, Project Astra (실시간 카메라/음성 연동) ChatGPT GPT-4o (실시간 대화 + 시각정보 응답 가능)
사용자 인터페이스 Android 통합, Pixel/스마트글라스/웹 등 다양한 플랫폼 ChatGPT 앱, 웹, 데스크톱 앱 (멀티모달 직접 사용 가능)
유료 서비스 AI Pro ($20/월), AI Ultra ($250/월) ChatGPT Plus ($20/월), Team/Enterprise 요금제
생태계 전략 Android + Gemini 통합 확장 / OEM 파트너들과 XR 구축 API 제공 + 앱 생태계 확장 (앱스토어 및 사용자 맞춤 GPT)

주요 비교 요약

  • OpenAI소프트웨어 중심의 AI 혁신에 집중하고 있으며, GPT-4o로 멀티모달의 정점을 찍음.
  • GoogleGemini 2.5를 중심으로 **하드웨어(XR 글라스)**까지 포함한 플랫폼 확장 전략을 추진 중.
  • 콘텐츠 생성 AI는 Google(Veo/Imagen)이 더 다양한 도구군을 소개한 반면, OpenAI는 더 높은 품질의 텍스트 중심 기능에 강점.
  • AI 비서 경쟁은 Google의 Astra와 OpenAI의 ChatGPT-4o 간 실시간 상호작용(AI + 카메라/음성) 분야에서 본격 경쟁 중.

 

아래는 기능별 세부 항목에 따른 Google I/O 2025 vs OpenAI (GPT-4o) 비교입니다.


1. 대화형 AI (멀티모달 능력)

기능 Google Gemini 2.5 OpenAI GPT-4o
텍스트 이해 고도화된 추론 기능 (Deep Think) 고속 응답 + 다중 문맥 이해
음성 인식 및 응답 Gemini Live – 실시간 대화 지원 (음성 명령 및 응답) Whisper + 실시간 반응, 감정 표현, 인터럽트 가능
이미지 인식 Astra – 실시간 카메라 기반 시각 정보 이해 이미지 분석 + 질문 응답 가능 (업로드 기반)
영상 이해 Veo 3 제작, 시연 수준에서 활용 가능 Sora 영상 생성 (이해는 아직 제한적)
카메라 연동 실시간 반응 Project Astra (카메라가 보는 상황을 인지하고 대응) GPT-4o는 카메라 기능 없음 (이미지 업로드만 지원)

2. 콘텐츠 생성 도구 (Create AI)

항목 Google I/O 2025 OpenAI (2024-2025)
이미지 생성 Imagen 4 (고해상도 표현, 배경·디테일 탁월) DALL·E 3 (리얼한 스타일, 이미지 편집도 가능)
영상 생성 Veo 3 (짧은 영화 수준의 영상 생성) Sora (현실적인 장면 생성, 공개 준비 중)
음악/음성 아직 없음 Suno (제휴), TTS 음성 더빙 지원
영상 편집/합성 Flow (사용자 편집형 영상 생성기) 없음 (현재는 타 플랫폼 연계 필요)

3. 스마트 디바이스 연동

항목 Google I/O 2025 OpenAI (2024-2025)
스마트 글라스 Android XR + Gentle Monster 협업 없음
AR 연동 Android 기반 XR 확장 (실시간 맵, 카메라 연동) 미제공
플랫폼 통합 Android 전반과 완전 통합 독립형 웹/앱 서비스

4. 사용 및 구독 모델

항목 Google I/O 2025 OpenAI (2024-2025)
무료 이용 범위 일부 Gemini 기능, 검색과 통합된 AI GPT-3.5 (무료), 제한적 GPT-4o 체험
유료 요금제 AI Pro ($20/월), AI Ultra ($250/월) Plus ($20/월), Team, Enterprise 등
맞춤형 기능 없음 맞춤 GPT, GPT Store 제공
API 제공 일부 Android XR SDK 예정 OpenAI API 완전 공개, 개발자 확장성 뛰어남

총평 요약

항목 Google I/O 2025 OpenAI (2024-2025)
강점 XR 디바이스 통합, 실시간 반응형 비서 자연스러운 대화, 고정밀 이미지/음성 처리
약점 독립형 서비스 적음, 영상 편집은 초기 단계 하드웨어 없음, 실시간 카메라 정보 수신 불가
전략 방향 Android 생태계 중심의 실생활 융합 범용 AI 도구 플랫폼 + API 생태계 확대
728x90
반응형