제논, 컴퓨터 직접 조작하는 ‘훈민 VLM 235B’ 공개해

2026-02-04 김미혜 기자, elecnews@elec4.co.kr

액셔너블 AI 솔루션 ‘원에이전트’ 고도화 및 피지컬 AI 확장 발판 마련

제논(대표 고석태)은 컴퓨터 화면의 요소를 인식하고 이를 직접 조작할 수 있는 시각언어모델(VLM) ‘훈민 VLM 235B’를 공개했다고 2월 4일 밝혔다.

이번 모델은 2025년 7월 공개한 ‘훈민 32B’의 후속 버전으로, 범용 지능을 유지하면서 시각 인지와 실행 능력을 대폭 강화한 것이 특징이다. 제논은 자사 AI 솔루션 ‘원에이전트(OneAgent)’의 업무 수행 역량을 극대화하기 위해 이번 모델 업그레이드를 진행했다.

특히 컴퓨터 화면을 정확히 식별해 원하는 위치를 클릭하는 ‘컴퓨터 유즈(Computer Use)’ 기술과 웹사이트를 넘나들며 복잡한 업무를 수행하는 ‘브라우저 유즈(Browser Use)’ 역량 강화에 초점을 맞췄다. 사용자의 명령을 이해해 업무의 시작부터 완결까지 직접 수행하는 ‘액셔너블(Actionable) AI’로서의 완성도와 실효성을 높였다는 설명이다.

훈민 VLM 235B는 알리바바의 Qwen3-VL(235B)을 기반으로 UI 이해, 마우스 이동 경로 등 1,000여 개 시나리오를 학습해 실무 환경에서의 실행력을 높였다. 내부 테스트 결과, 정밀 조작 영역과 일상 업무 수행에서 기존 모델 대비 유의미한 성능 향상을 기록했다.

제논은 이번 모델을 자사 AI 솔루션 ‘원에이전트(OneAgent)’에 적용해 업무 자동화 범위를 확대하는 한편, 향후 물리적 환경까지 제어하는 ‘피지컬 AI’로 확장할 계획이다. 현재는 화면 요소 인식과 실행을 중심으로 PoC를 진행 중이다.

또한 제논은 훈민 VLM 235B의 모델 가중치와 학습 데이터, 방법론을 글로벌 AI 커뮤니티 허깅페이스에 공개해 국내외 생성형 AI 생태계 발전에 기여한다는 방침이다.

명대우 제논 부사장은 “현재의 LoRA 튜닝 단계를 넘어 향후 풀 파라미터(Full Parameter) 학습으로 확장하고, 강화학습(RL) 및 시뮬레이션 기반 데이터 생성 파이프라인 고도화를 통해 자율 수행 능력을 지속적으로 업데이트할 것”이라며, “액셔너블 AI를 넘어 피지컬 AI까지 기술력을 단계적으로 확장해 산업 현장의 AI 전환을 실질적으로 이끄는 핵심 기술 기업으로 도약하겠다”고 밝혔다.

100자평 쓰기

스노우플레이크, 데이터·AI를 ‘운영 단계’로 끌어올리는 기술 혁신 발표

솔트웨어, 3년 만에 영업이익 흑자전환 성공하며 AI 중심 사업 재편 결실 맺어

참슬테크, 반포 래미안에 테슬라 자율주행 호출 ‘첫 실전 적용’

웨스턴디지털, AI 데이터 시대 겨냥한 100TB+ HDD 로드맵 공개

잡코리아, 공고 나열 대신 ‘오늘의 AI 인사이트’ 도입하며 메인 화면 전면 개편해

지멘스, 가트너 매직 쿼드런트 품질 관리 시스템 소프트웨어 부문 리더 선정

현대차그룹, 위즈 도입 통한 멀티클라우드 보안 가시성 강화

인텔, AI 개발·시뮬레이션용 제온 600 워크스테이션 프로세서 공개해