(KO) 다양한 실시 예에 따른 사용자 단말 장치는, 디스플레이, 적어도 하나의 센서, 통신 모듈 및 디스플레이, 적어도 하나의 센서 및 통신 모듈과 작동적으로 연결된 프로세서를 포함하고, 프로세서는, 사용자 발화 음성이 수신되면, 적어도 하나의 센서로부터 획득된 센싱 값 또는 디스플레이의 비활성화 기간 중 적어도 하나를 기반으로 디스플레이를 통해 사용자 발화 음성에 대응되는 응답 화면을 제공 가능한 상태인지 결정하고, 디스플레이를 통해 응답 화면을 제공할 수 없는 상태인 것으로 결정하면, 통신 모듈을 통해 사용자 단말 장치와 연결된 적어도 하나의 외부 장치의 현재 상태 정보를 수신하고, 적어도 하나의 외부 장치의 현재 상태 정보를 기반으로 응답 화면을 표시할 하나의 외부 장치를 결정하고, 사용자 발화 음성에 대한 응답 화면을 획득하고, 통신 모듈을 통해 하나의 외부 장치로 응답 화면을 전송하도록 설정될 수 있다. 한편, 인공지능 모델을 이용하여 인공지능 가상 비서 서비스에서의 사용자 단말 장치 또는 서버의 화면 제공 방법을 수행할 수도 있다.