인터넷 없이 AI를 쓸 수 있다면 어떨까요. 와이파이가 끊긴 비행기 안에서, 보안이 엄격한 폐쇄망 환경에서, 혹은 데이터를 외부로 내보내기 어려운 업무 현장에서도 AI 어시스턴트를 그대로 쓸 수 있다면요.구글이 공개한 'Google AI Edge Gallery'앱은 그 가능성을 현실로 가져온 시도입니다.최신 오픈소스 모델 Gemma 4를 스마트폰 위에서 직접 실행하는 방식으로, 모델을 한 번 내려받고 나면 이후 모든 처리가 기기 안에서만 이뤄집니다.2026년 4월 Google Cloud Next에서 발표된 Gemma 4는 Apache 2.0 라이선스로 완전 오픈소스화됐습니다.E2B(2B), E4B(4B), 26B MoE, 31B Dense 등 다양한 크기로 제공되며, 그중 모바일 최적화된 E2B·E4B 모델이 스마트폰에서 원활하게 작동합니다.안드로이드와 iOS 모두 지원되고, 구글'>구글 GitHub에 소스코드가 공개돼 있어 개발자가 직접 커스터마이징하는 것도 가능합니다.이 앱에서 실제로 할 수 있는 것들단순한 챗봇에 그치지 않습니다. AI Edge Gallery는 크게 여섯 가지 기능을 온디바이스로 제공합니다.AI Chat: 다중 턴 대화가 가능하고, 'Thinking Mode'를 켜면 AI가 추론하는 과정을 단계별로 시각화해서 볼 수 있습니다.Ask Image: 사진을 올리고 질문합니다. 사물 인식, 시각적 퍼즐 풀기 등 멀티모달 기능입니다.Prompt Lab: 요약, 코드 생성, 문체 변환 같은 작업을 단일 프롬프트로 실행합니다.Audio Scribe: 오디오를 텍스트로 변환하거나 다른 언어로 번역합니다.Mobile Actions: 알람 설정해처럼 자연어로 기기를 제어합니다.Agent Skills: Wikipedia 검색, 지도 등 오프라인 범위 구글'>구글 내 도구를 연결합니다.스냅드래곤 8 Gen 3 기준으로 AI Chat에서 초당 5,000토큰 이상 처리가 가능하고, 코드 생성도 1~2초 내에 결과가 나옵니다. NPU가 내장된 퀄컴·미디어텍 계열 칩에서 최적화 효과가 가장 큽니다.기능주요 모델하드웨어 요건처리 속도 (Snapdragon 8 Gen 3 기준)AI ChatGemma 4 E4B6GB RAM 이상5,000+ tok/sAsk ImageGemma 4카메라 지원 기기실시간 인식Prompt LabGemma 4 / Llama 3.2기본 사양코드 생성 1~2초5분 안에 시작하는 설치 방법설치 자체는 어렵지 않습니다. 아래 순서를 따라가면 됩니다.Google Play(안드로이드) 또는 App Store(iOS)에서 'Google AI Edge Gallery'를 검색해 설치합니다.앱을 열면 모델 선택 화면이 나옵니다. 저사양 구글'>구글 기기라면 Gemma 4 E2B, 8GB RAM 이상이라면 E4B를 선택합니다. 다운로드 용량은 2~4GB 수준입니다.다운로드 완료 후 AI Chat에서 인터넷을 끊고 질문을 입력해 오프라인 작동 여부를 직접 확인해봅니다.Prompt Lab에서 Python으로 웹 스크래퍼 작성해처럼 구체적인 작업 지시를 넣어보면 성능 차이를 체감할 수 있습니다.갤럭시 A 시리즈처럼 중저가 기기에서도 Gemma 4 E2B는 원활하게 작동한다는 후기가 많습니다. 1시간 대화 기준 배터리 소모는 10~15% 수준으로 보고됩니다. 초기 다운로드는 와이파이 환경에서 하는 게 편리합니다.쓸 만한 이유와 알아둘 한계가장 눈에 띄는 장점은 프라이버시입니다.데이터가 서버로 전송되지 않기 때문에, 민감한 업무 문서나 개인 내용을 입력해도 외부 유출 경로가 없습니다.구독료나 API 요금도 없어서 설치 후에는 추가 비용이 발생하지 구글'>구글 않습니다.Hugging Face에 올라온 다른 모델을 직접 불러올 수 있다는 점도 확장성을 높여줍니다.다만 몇 가지는 미리 알아두는 게 좋습니다.이미지 생성(Stable Diffusion 계열)은 아직 지원하지 않습니다.8GB RAM 미만 기기에서 E4B 모델은 버벅임이 생길 수 있으니 E2B를 권장합니다. 스트리밍 오디오나 RAG 연동 같은 기능은 향후 업데이트 로드맵에 포함돼 있다고 알려져 있지만, 현재 버전에서는 제공되지 않습니다.누가 쓰면 가장 유용한가사용 목적에 따라 체감 효용이 꽤 다릅니다. 실제로 활용도가 높은 상황을 정리하면 아래와 같습니다.여행자: 데이터 로밍 없이 현지 정보를 묻거나 오프라인 지도와 연계해 대화로 길을 찾습니다.개발자: Prompt Lab에서 코드 생성과 디버깅을 빠르게 반복할 수 있습니다.학생: Ask Image로 교재 사진을 찍어 개념 설명을 요청하거나 구글'>구글 수식을 해석합니다.보안이 중요한 직군: 폐쇄망 환경에서 문서 요약이나 초안 작성 작업에 활용합니다.Gemma 4는 AIME 2026 수학 벤치마크에서도 상위권 성능을 기록했습니다.온디바이스 모델치고는 추론 품질이 상당하다는 평가가 나오는 이유입니다.온디바이스 AI, 앞으로 어디까지 갈까구글은 AI Edge Gallery를 단독 앱으로 끝낼 생각이 없어 보입니다.Android AICore와 연계해 OS 수준으로 온디바이스 AI를 내재화하는 방향이 거론되고 있습니다.기기 위에서 직접 돌아가는 AI가 클라우드 AI와 어떤 역할 분담을 하게 될지는 앞으로의 업데이트를 지켜봐야 알 수 있습니다.지금 당장 체험해보고 싶다면, 앱을 설치하고 비행기 모드로 전환한 뒤 질문을 하나 던져보세요.인터넷 없이 AI가 답을 내놓는 그 경험이, 이 기술이 어디까지 왔는지를 가장 직접적으로 보여줍니다.