| About the Journal | Browse Archives | For Reviewers | For Authors |
Sorry.
You are not permitted to access the full text of articles.
If you have any questions about permissions,
please contact the Society.
죄송합니다.
회원님은 논문 이용 권한이 없습니다.
권한 관련 문의는 학회로 부탁 드립니다.
| [ Article ] | |
| Transactions of the Korean Society of Automotive Engineers - Vol. 34, No. 2, pp. 249-265 | |
| Abbreviation: KSAE | |
| ISSN: 1225-6382 (Print) 2234-0149 (Online) | |
| Print publication date 01 Feb 2026 | |
| Received 03 Sep 2025 Revised 16 Sep 2025 Accepted 16 Sep 2025 | |
| DOI: https://doi.org/10.7467/KSAE.2026.34.2.249 | |
| 프롬프트 구조화 기반 실내 생성 | |
왕자문* ; 김진성
| |
| 세종대학교 디자인이노베이션 | |
Structured Prompts for Interior Generation | |
Ziwen Wang* ; Jinsung Kim
| |
| Design Innovation, Sejong University, Seoul 06220, Korea | |
| Correspondence to : *E-mail: jinsungk@sejong.ac.kr | |
Copyright Ⓒ 2026 KSAE / 243-10 This is an Open-Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License(http://creativecommons.org/licenses/by-nc/3.0) which permits unrestricted non-commercial use, distribution, and reproduction in any medium provided the original work is properly cited. | |
This study proposes a controllable, language-driven pipeline for an interior product design that bridges fuzzy prompts and deployable 3D results. We recast prompts as a structured slot system—Function, Context, and Style—and couple BLIP/CLIP-based semantic alignment with text-to-image generation and NeRF-based 3D reconstruction to produce “white models” that were suitable for an initial design. Using identical rules and execution settings, we validated the method across four scenarios, from furniture-centric rooms to a smart cockpit interior. The approach improved style tone control, placement logic, and traceability from input to output, while also revealing limits under composite tasks where spatial scale or user flow induced semantic disconnects. We outlined constraint tokens and prompt-linting to mitigate these issues, and discussed portability across domains. The results indicated a reproducible path to prompt-centric, expression-structured design workflows.
| Keywords: Structured prompts, Smart cockpit, CLIP/BLIP alignment, NeRF-based 3D reconstruction, White model, Contextual fitness 키워드: 구조화된 프롬프트, 스마트 콕핏, CLIP/BLIP정렬, NeRF 기반 3D 재구성, 화이트 모델, 맥락 적합성 |
|
최근 제품 디자인 분야에서 생성형 인공지능(AIGC)의 활용은 실질적인 활용 가능성과 높은 발전 가능성을 입증하고 있다.1) 특히 Transformer 아키텍처에 기반한 BERT 모델은 대규모 텍스트 데이터를 분석하여 사용자가 선호하는 가구의 기능, 디자인 스타일, 소재 등에 대한 내재적 요구를 정밀하게 도출할 수 있다. 이와 더불어 감성 분석 기법을 통해 사용자 선호도를 정량화함으로써, 디자인 전략 수립 시 객관적인 데이터에 기반한 의사결정이 가능하게 된다.
디자인 프로세스 전반에 인공지능 기술이 통합되면서, 설계 효율성이 크게 향상되고 창의성 중심의 디자인 혁신도 촉진되고 있다. 특히 초기 디자인 콘셉트 발굴 단계에서는 자연어 처리(NLP)와 데이터 마이닝 기법을 접목하여, 소셜 미디어, 소비자 평가, 시장 조사 자료 등 비정형 데이터를 체계적으로 분석함으로써 핵심적인 사용자 요구와 시장 흐름을 정제된 형태로 도출할 수 있다.2) 이 과정에서 AI는 주요 키워드와 트렌드를 식별하여 디자이너에게 직관적인 인사이트를 제공하며, 이는 후속 디자인 개발의 기반 자료로 활용될 수 있다.
딥러닝 기반의 신경망 모델은 학습 과정에서 다양한 데이터 유형의 내재된 특징을 효과적으로 파악하며, 전통 가구 문양에 대한 이미지 데이터와 현대 가구의 구조적 정보가 포함된 파라미터 라이브러리 등 이질적인 멀티소스 자료를 통합하여 가구 디자인의 표현 영역을 확장하는 데 기여하고 있다.
특히 합성곱 신경망(CNN)과 Transformer의 결합적 활용은, 주의 메커니즘(Attention mechanism)과 특징 피라미드 네트워크(FPN) 기술의 통합을 통해, 전통 목공예의 조각 문양, 천공 방식, 손모춤 구조와 같은 세부 요소뿐 아니라, 힌지 기반의 개폐 방식이나 모듈형 결합 등 현대적 설계 요소를 세밀하게 추출할 수 있게 한다.
또한 생성적 적대 신경망(GAN)을 활용한 추론 단계에서는, 가우시안 잡음이나 스타일 속성 등의 조건부 변수를 도입하여, 중식 스타일, 북유럽 감성, 인더스트리얼풍 디자인 등 다양한 미적 성향을 반영한 3차원 형상 생성이 가능해진다.3)
현행 3D 모델링 시스템은 대형 멀티모달 모델(Large Multimodal Models, LMM)을 핵심 기반으로 삼아, ‘다중 모달 입력 – 의미적 정보 추출 – 3차원 복셀 구조 생성 – 반복적 최적화’라는 일련의 표준화된 처리 흐름을 형성하고 있다. 이와 같은 프레임워크는 OpenAI의 CLIP(대조적 언어-이미지 사전학습) 및 Salesforce의 BLIP(단계적 언어-이미지 사전학습) 기술을 활용하여 텍스트, 시각 이미지, 포인트 클라우드 간의 상호 연관성을 정렬하고, 여기에 NeRF(Neural Radiance Fields) 기법을 접목하여 고해상도 3차원 장면의 정밀 재구성이 가능하도록 지원한다.4)
가구 디자인 응용에서는 사용자의 요구 사항이 담긴 텍스트, 참조 이미지, 공간 치수 등 다양한 제약 조건을 통합한 뒤, 초기 입력 프롬프트 생성, 기본 모델 제안, 피드백 기반의 반복 최적화 절차를 통해 특정 실내 환경에 적합한 3D 가구 화이트 모델을 빠르게 산출할 수 있다.
예를 들어, 사용자가 특정 이미지를 입력하면, CLIP Interrogator는 이미지 내용을 자동 분석하여 핵심적 특성을 도출하고, 해당 정보를 기반으로 스타일 프롬프트를 생성한다. 이후 Stable diffusion 알고리즘은 이 프롬프트를 활용해, 사용자 요구가 반영된 새로운 디자인 이미지를 생성하는 방식으로 활용된다.
본 연구는 생성형 인공지능 기술이 가구 디자인 과정에 적용되는 과정에서 발생하는 핵심적인 문제점을 분석하고, 텍스트 기반 프롬프트와 생성 모델 간의 의미적 연계 메커니즘을 체계적으로 규명하는 데 목적이 있다. 이를 통해 프롬프트 언어의 명료성을 높이고, 생성 결과물의 실용성과 맥락 적합성을 동시에 향상시키는 것을 연구의 주요 방향으로 설정하였다. 본 논문의 세부 연구 목표는 다음과 같다.
(1) 가구 디자인 시나리오에 적용 가능한 프롬프트 템플릿을 개발하며, 기능적 요구, 공간 배치 상황, 스타일 속성 등 세 가지 핵심 요소를 중심으로 프롬프트의 구조적 구성과 논리적 체계를 정교화한다.
(2) CLIP Interrogator, BLIP, Stable diffusion 등의 대표적인 생성 AI 도구를 통합하여, 이미지와 텍스트 간의 의미 해석 과정과 시각 정보 생성 간의 상호작용 경로를 구성하고, 모델 간 협력 기반의 생성 흐름을 설계한다.
(3) NeRF(Neural Radiance Fields) 기반 알고리즘을 도입하여 생성된 2D 이미지를 공간 정보를 반영한 3차원 가구 화이트 모델로 변환하고, 다양한 응용 시나리오 내에서의 삽입 테스트를 통해 생성 결과의 맥락 대응 능력과 기능적 적합성을 평가한다.
이 연구는 “의미 정보 추출 – 프롬프트 체계화 – 이미지 생성 – 3차원 복원 – 적합성 평가”의 다단계 기술 경로를 중심으로 전체 시스템을 설계하였다. 우선, 사용자가 입력한 이미지나 자연어 텍스트로부터 핵심 개념 및 시각적 특성을 추출한 뒤, 이 정보를 기반으로 기능, 스타일, 공간 조건을 아우르는 계층적 프롬프트 구조를 형성한다. 이후 Stable diffusion 기반의 이미지 생성 모델을 통해 초기 화이트 모델(White model)을 생성하고, 여기에 의미 교란 기법(Semantic perturbation mechanism)을 적용함으로써 다양한 스타일적 변형 결과물을 도출한다.
그다음 단계에서는 NeRF(Neural Radiance Fields) 기술을 활용하여 2차원 이미지에 내포된 시각 정보를 3차원 공간 구조로 재구성하며, 생성된 모델의 정합성을 확보한다. 마지막으로, 복원된 3D 결과물을 대표적인 디자인 시나리오에 적용하여 시나리오 기반 평가(적합성 분석)를 수행하며, 이 과정에서 모델의 기능 충족 여부, 공간 내 비례적 조화, 스타일 일관성 등의 기준을 통해 생성물의 품질과 실용적 활용 가능성을 종합적으로 진단한다.
이와 같은 일련의 절차를 통해 본 연구는 언어 기반 사용자 입력으로부터 실제 디자인 출력에 이르기까지 연결되는 일관된 생성 경로를 정립하고자 하였으며, 향후 생성형 인공지능 기술의 가구 디자인 분야 실무 적용을 위한 체계적인 방법론과 실증적 평가 기준을 제안하고자 한다.
본 연구는 생성형 인공지능 기술이 가구 디자인 분야에 효과적으로 적용될 수 있도록, 프롬프트 중심의 생성 프로세스를 기반으로 하는 통합 기술 프레임워크를 제안하였다. 전체 시스템은 총 다섯 단계―의미 해석, 프롬프트 설계, 시각 이미지 생성, 구조 변환, 출력 결과 분석―로 구성되며, 사용자 입력(텍스트 또는 이미지)으로부터 공간성을 내포한 3차원 가구 모델을 효과적으로 도출하는 것을 주요 목표로 설정하였다.
초기 단계인 의미 해석 절차에서는, BLIP 모델을 활용하여 입력된 사용자 요청으로부터 기본적인 자연어 기술을 자동 생성한 후, CLIP Interrogator 모듈을 통해 디자인 관련 핵심 정보―기능 속성, 공간 배치 정보, 스타일 특성 등―를 정밀하게 추출한다. 이 정보는 후속 생성 단계를 위한 프롬프트 구문으로 구조화되며, 복수의 층위를 갖는 계층적 구성으로 정리된다.
프롬프트 설계 단계에서는, 정보 간 의미적 연관성을 기반으로 내용 그룹화를 수행하고, 생성 모델의 응답 정확도를 높이기 위해 중요도에 따라 항목별 우선순위를 지정한다. 이를 통해 프롬프트 구성의 논리적 방향성이 강화되며, 중복 입력 또는 의미 충돌과 같은 오류 발생 가능성을 최소화할 수 있다.
이미지 생성 과정은 Stable diffusion 모델을 기반으로 수행되며, 이 단계에서는 프롬프트에 의미 교란(Semantic perturbation) 요소를 전략적으로 포함시켜, 상이한 스타일 특성을 반영한 복수의 후보 이미지를 생성한다. 이러한 방식은 시각적 다양성을 확보함과 동시에 생성 결과물의 표현 범위를 확장하는 데 기여한다. 생성된 2D 이미지는 다음 단계인 구조 복원 절차로 이관되며, 본 연구는 NeRF(Neural Radiance Fields) 알고리즘을 적용하여 공간 비례성과 구조적 일관성을 갖춘 3차원 화이트 모델(White model)로 변환함으로써 실제 시나리오 적용이 가능한 기반 데이터를 구축하였다.
최종 단계인 결과 분석에서는, 소형 주거 공간, 업무 환경, 다세대 거주지, 자동차 실내 공간 등 다양한 실내 환경 시나리오를 선정하고, 해당 맥락 내에 생성된 3D 모델을 적용하여 적합성을 평가하였다. 이 과정에서는 기능 수행의 가능성, 공간적 배치의 조화 여부, 스타일 일관성 등 여러 항목에 대한 정성적⋅정량적 분석을 병행하였으며, 프롬프트 중심의 생성 경로가 실제 디자인 요구를 어느 정도 충족하는지를 판단하였다. 그 결과, 특정 스타일이나 공간 조건에 따른 생성 품질의 편차 및 세부 구조 구현의 한계 등 일부 보완 지점도 도출되었다.
전체적으로 볼 때, 본 연구가 제안한 생성 프로세스는 단일 모델 성능에 의존하기보다는, 자연어 입력 – 이미지 생성 – 3D 복원에 이르는 다중 모듈 간 연계 경로의 최적화를 핵심으로 한다. 이와 같은 통합적 접근은 전통적인 3D 모델링 도구에 의존하지 않고도, 초기 디자인 개념 설정 및 설계안 도출을 가능하게 하며, 실무적 측면에서도 일정 수준 이상의 활용 가능성을 제공하는 것으로 판단된다.
다양성 공간 가구를 위한 인공지능 기반 모델링 체계에서, 기능 중심의 프롬프트 구성은 인간공학적 설계 요소를 정형화된 의미 단위로 변환하는 절차를 요구한다. 이를 실현하기 위해, 본 연구는 CLIP 모델의 텍스트 인코딩 과정에 인간공학 관련 태그를 삽입함으로써, 텍스트-이미지 간 크로스모달 매핑을 가능하게 하였으며, 결과적으로 3D 모델 생성의 정확도와 실용성을 제고하였다. 본 연구에서 사용된 가구 생성 프롬프트는 주요 기능적 역할을 기준으로 다음과 같이 구성된다:
수납 기능 중심 가구의 경우, 프롬프트는 “기능(Functionality) – 구조(Structure) – 효율(Efficiency)”의 삼중 구성을 바탕으로 단계적으로 설계된다. 예를 들어, 옷장을 설계하는 시나리오에서는 다음과 같은 항목이 포함되어야 한다:
걸이 구역은 의류 유형에 따라 높이 조정이 가능해야 하며, 접이식 보관 구역은 수납 용량에 부합해야 하고, 서랍 유닛은 사용자의 동작 범위 내에 위치해야 한다.
이러한 파라미터는 논리적 연산자를 활용해 조합되며, BLIP 모델의 의미 해석 능력과 통합될 때 수납 공간 활용의 최적화를 유도할 수 있다.
전시용 가구의 경우에는 시각적 속성을 강조한 프롬프트 설계가 필요하다. 예시로는 “투명 재질의 디스플레이 박스 ∣ 다양한 각도의 조명 효과 ∣ 선반의 하중 조건 명시” 등이 있으며, 이러한 프롬프트 구조는 시각적 태그 그룹을 통해 장식성과 실용성을 동시에 반영하는 결과 생성에 기여한다.
주거용 가구는 물리적 수납 외에도 공간을 구획하는 중요한 역할을 수행한다. 거실, 주방, 침실, 서재 등 서로 다른 기능적 영역을 하나의 통합된 공간 내에서 시각적으로 분리하기 위해, 프롬프트에는 배치 구조 및 배경 연계 요소가 포함되어야 한다.
예를 들어, “스크린”, “저상형 수납장”, “소파” 등과 같은 키워드는 휴식 공간과 식사 공간의 자연스러운 구분을 가능하게 하며, 오픈 플랜 구조에서는 “아일랜드 키친 테이블”을 중심으로 조리 공간과 다이닝 공간 간의 경계를 명확히 설정할 수 있다. 이러한 구획 전략은 공간 내 기능의 명료화를 도모할 뿐 아니라, 시각적 깊이와 입체감을 증대시키는 데에도 효과적이다.
장식적 기능:
(1) 공간 스타일 정립
가구의 형상, 재료, 색채 등 시각적 요소는 실내 공간의 전반적인 스타일 정체성을 형성하는 데 결정적인 역할을 수행한다. 현대 미니멀리즘, 유럽 고전주의, 전통 중식 양식, 북유럽 디자인 등 다양한 스타일 유형 가운데, 공간의 디자인 컨셉과 조화를 이루는 가구를 선택함으로써 공간 내 통일성과 미적 일관성을 확보할 수 있다.
예컨대, 미니멀리즘 기반의 현대적 주거 환경에서는 직선 위주의 형태, 단순화된 구조, 기능 중심의 신소재 가구가 주로 채택되며, 이러한 선택은 간결하면서도 세련된 시각적 인상을 부각시킨다. 반면, 유럽식 클래식 공간에서는 섬세한 조각이 가미된 원목 가구, 자수나 브로케이드 등 화려한 직물 장식, 황동이나 금속 장식 요소가 사용되어 고풍스럽고 품격 있는 분위기를 연출한다.
(2) 색채 및 질감 표현
가구의 색상과 표면 질감은 실내 공간에 장식성과 감성적 깊이를 더하는 핵심 요소 중 하나이다. 강렬한 컬러를 지닌 가구는 시각적 강조 효과를 통해 공간에 역동성과 활력을 부여할 수 있으며, 파스텔 톤이나 뉴트럴 계열의 색상은 부드럽고 안정적인 분위기를 조성하는 데 효과적이다.
예를 들어, 전체적으로 백색 계열의 공간에 강렬한 원색(예: 레드 계열의 의자 또는 블루 계열의 소파)을 부분적으로 배치하면, 시각적 중심점이 형성되어 공간의 입체적 깊이감이 강화된다. 더불어, 가구의 소재 선택은 촉감뿐 아니라 공간의 감성 연출에도 중요한 영향을 미친다. 자연 목재는 따뜻하고 편안한 분위기를, 천연 가죽은 고급스러움과 안정감을, 금속 재질은 세련되고 현대적인 감각을 사용자에게 전달한다.
스타일과 공간 간의 통합적 조화:
주거 공간 내 가구 디자인에서 스타일과 전체 공간 구성 간의 일관된 조화는 시각적 안정감과 기능적 효율성 모두에 중요한 영향을 미친다. 예를 들어, 현대 미니멀리즘 스타일은 간결한 직선 구성과 단순화된 형태를 핵심 요소로 삼으며, 색채는 흰색, 회색, 베이지 등 중립적 계열이 주로 선택된다. 이에 적합한 가구는 금속, 유리, 가죽 등 현대적 감각이 강한 소재로 제작된 제품이며, 기하학적 구조의 티 테이블이나 구조적 장식이 배제된 소파 등이 대표적 사례에 해당한다.
반대로, 유럽 고전주의 스타일은 곡선 위주의 복잡한 실루엣, 화려한 장식 요소, 정교한 조각 기법을 강조하며, 따뜻한 계열의 색상과 천연 소재의 활용이 두드러진다. 이와 같은 공간에는 조각된 원목 프레임의 소파, 장식이 풍부한 식탁 또는 클래식한 장롱 등 장식성과 기능성이 동시에 고려된 가구가 효과적으로 배치될 수 있다.
색채 및 소재의 상호작용:
가구 디자인에서 색상과 재료 선택은 공간의 분위기를 결정짓는 핵심 구성 요소로, 시각적 인상뿐 아니라 감성적 경험에 직결되는 속성을 지닌다.
색채는 공간 전체의 톤과 일관성을 유지하기 위한 중요한 변수로, 예를 들어 전체 공간이 백색이나 베이지 계열의 밝은 색상으로 구성되어 있을 경우, 가구 역시 유사한 톤을 채택함으로써 공간 전체의 연속성과 시각적 안정감을 유지할 수 있다. 또한, 색상 선택은 단순한 미학적 요소를 넘어서, 공간의 기능성과 사용 목적에 따른 전략적 고려가 필요하다. 예컨대 작업 공간에는 집중력을 유도하는 차분한 색상을, 휴식 공간에는 따뜻하고 안정감을 주는 색조를 사용하는 것이 바람직하다.
소재 측면에서 보면, 재질은 촉감과 분위기를 동시에 전달하는 매개체로 기능한다. 예를 들어, 목재는 자연친화적이고 따뜻한 질감을 제공하며, 금속 소재는 차가우면서도 세련된 인상을 부여하고, 가죽 재질은 고급스럽고 부드러운 감각을 강조하는 데 효과적이다. 이처럼 색상과 소재의 조화로운 결합은 단순한 가구 선택을 넘어 공간 전체의 스타일 정체성을 결정짓는 핵심 요소로 작용한다.
생성형 인공지능이 실제 가구 디자인 과정에 실질적인 창작 도구로 기능하기 위해서는, 단순히 모델의 매개변수 규모나 출력 해상도에 의존하는 것이 아니라, 프롬프트 자체의 구조적 명료성과 의미적 정밀성, 그리고 디자인 논리에 부합하는 체계적 구성력이 핵심 요인으로 작용한다.
현재 사용되는 대다수의 대형 사전학습 멀티모달 모델들은 텍스트-이미지 간 정렬 능력을 기반으로, 시각적 정보로부터 색상, 질감, 재질, 구조 등 설명적 속성을 추출하는 데에는 강점을 보인다. 그러나 이러한 키워드는 주로 표면적 특징에 국한되며, 가구 디자인에서 핵심적으로 요구되는 기능 기반의 구조 논리나 공간 내 배치 연계성과 같은 설계 문맥에 필요한 심층 정보는 충분히 반영하지 못하는 한계가 존재한다. 5)
이러한 한계를 극복하기 위해서는, 프롬프트를 단순한 데이터 입력값으로 취급하는 것을 넘어, 디자인 생성 시스템 내부의 규칙 기반 언어 구조(Language architecture rule)로 간주하고, 설계 맥락에 최적화된 방식으로 조직할 필요가 있다. 즉, 프롬프트는 명시적 지시어 이상의 역할을 수행하며, 생성 모델의 인식 구조를 유도하고, 결과물의 공간 적합성과 기능 논리에 직결되는 잠재적 제어 메커니즘으로 기능해야 한다.
따라서 프롬프트 엔지니어링의 최적화는, 가구의 사용 목적, 공간 구조, 미적 방향성 등 다차원적 요소를 반영하는 계층적 구성 전략을 포함해야 하며, 이를 통해 복합 스타일 및 혼합 기능을 지닌 가구 디자인 요구에 보다 정교하게 대응할 수 있는 기반을 마련할 수 있다.
본 연구는 프롬프트 기반 생성 시스템의 효율성을 제고하기 위해, 이해 가능성과 제어 가능성을 동시에 갖춘 의미 계층 구조(Semantic layered system)를 제안하였다. 제시된 프롬프트 계층 체계는 총 세 가지 분석 차원을 중심으로 구성되며, 각각은 (1) 가구의 핵심 기능, (2) 배치될 공간의 환경 맥락, (3) 시각적 스타일 속성에 해당한다.
우선 기능 중심 계층에서는 가구의 사용 목적 및 동작 논리를 명시하는 프롬프트가 중심을 이룬다. 예를 들어 “높이 조절형 스탠딩 데스크”, “신발 수납이 가능한 접이식 벤치”, “어린이 보호 장치가 내장된 침대”와 같은 표현은, 생성 모델이 형태적 출력물에서 기능적 요구를 어떻게 반영할지를 결정짓는 핵심 입력으로 작용한다.
다음으로, 공간 맥락 계층은 해당 가구가 배치될 공간 유형에 대한 정보 제공을 목표로 한다. 프롬프트 내 “협소형 주방”, “개방형 서재 공간”, “복합형 사무 환경” 등의 표현은 시스템이 스케일(Scale)과 경계(Boundary) 개념을 인지하고 공간 배치 논리를 이해하는 데 필요한 조건적 단서를 제공한다. 6)
마지막으로, 스타일 속성 계층은 재질, 색감, 마감 방식 등 시각적 디테일을 구체화하는 데 중점을 둔다. 예컨대 “원목 질감 마감”, “그레이와 블루 계열의 조화”, “브러시 처리된 금속 프레임” “패밀리카 내부”등의 항목은, 디자인 언어의 인식 가능성을 높일 뿐 아니라, 사용자의 문화적 미감과 선호 경향을 반영하는 데에도 효과적인 구성 요소로 기능한다.
이와 같은 의미 계층 구조는 프롬프트를 단순한 설명 수준을 넘어, 생성 모델의 표현 제약과 디자인 해석 범위를 조정할 수 있는 언어적 인터페이스로 확장하는 데 핵심적인 역할을 수행한다.
프롬프트가 단순한 의미 항목의 나열 수준에 머무르지 않고, 생성 시스템 내부에서 실질적인 명령 실행 모듈(Command engine)로 기능하기 위해, 본 연구는 ‘의미적 가중치 할당’과 ‘구조적 조합 구성’으로 이루어진 이중 조절 프레임워크를 도입하였다.
이 전략은 각 프롬프트 유형에 상대적인 의미 비중(Weight)을 부여하고, 시스템은 추론(Inference) 단계에서 목표로 설정된 시나리오 조건을 기반으로 해당 가중치를 실시간으로 조정할 수 있도록 설계되었다.
예를 들어, 가정 내 부모-자녀 공동 공간에 적합한 건강 관리용 테이블을 설계하는 경우, 시스템은 “곡면 가장자리(Soft edge)”, “높이 조절 기능”, “사용자 동작 인식”과 같은 키워드에 대한 호출 빈도를 증가시킴으로써, 안전성과 유연성 중심의 디자인 요소를 우선 반영한다. 반면, 업무 공간과 같이 협업 중심의 시나리오에서는 “조명 분산 설계”, “소리 흡수 소재”, “모듈형 공간 분할” 등의 항목에 상대적으로 높은 생성 비중이 부여되며, 프롬프트의 내용이 해당 맥락에 적합하게 조정된다.
이와 같은 동적 프롬프트 조절 메커니즘은 프롬프트를 더 이상 고정된 단어 집합이 아닌, 목적 지향적 시나리오에 맞추어 의미를 분배하고 설계 흐름을 유도하는 제어 언어(Control language)로 기능하게 만든다. 7) 이러한 접근은 생성형 인공지능의 디자인 활용에서 프롬프트의 전략적 위상을 크게 향상시키는 방향성을 제시한다.
전체 프롬프트 체인이 구성된 이후, 생성 결과의 품질을 제어하기 위한 의미 일관성 검증 단계(Semantic consistency review)가 추가적으로 수행된다. 본 연구는 CLIP 모델의 크로스모달 유사도 계산 기능을 활용하여, 생성 대상 이미지와 프롬프트 간의 의미적 정합성을 평가하였으며, 이 과정에서 결합 강도(Coupling strength)가 낮은 단어 조합은 사전 필터링을 통해 제거함으로써, Stable diffusion에 전달되는 입력값의 표현 정밀도를 향상시키는 전략을 적용하였다. 8)
실험 결과, 해당 검토 절차는 생성된 결과물의 스타일 일관성 유지 및 기능적 대응력 측면에서 유의미한 성능 향상을 가져온 것으로 나타났다. 특히 디자인 속성의 유지와 세부 기능에 대한 모델 응답의 정합성이 강화되었으며, 이는 프롬프트의 구조화 방식이 생성 모델의 응답 품질에 실질적인 영향을 미친다는 점을 시사한다.
나아가, 이처럼 검증 절차를 거친 프롬프트는 단순한 정보 입력으로서의 역할을 넘어서, 사용자 요구와 생성 알고리즘 간의 의미적 중재(Intermediary) 기제로 기능할 수 있다. 다시 말해, 프롬프트는 사용자 언어의 표현과 AI 모델의 작동 논리 간을 연결하는 설명 가능한 인터페이스(Explainable interface)로 작동하며, 이는 인공지능 설계 구조 내에서 드물게 인간 해석 가능성이 확보된 소통 수단으로 간주될 수 있다.
본 장에서는 제안한 생성 체계를 어떤 기준으로 평가하는지를 우선적으로 규정한다. 본 연구의 관심은 단순히 정량적 지표의 우위를 주장하는 데 있지 않으며, 오히려 절차가 일관성 있게 수행되는지, 그리고 단계별 산출물을 통해 설계적 추론 과정이 명확히 추적 가능한지에 중점을 둔다. 구체적으로는, 계층적으로 구성된 프롬프트 슬롯 체계가 형태⋅재질⋅사용 맥락을 공통 규칙으로 일관되게 서술하는지, 더 나아가 동일한 규칙이 가구 중심의 실내 환경과 스마트 콕핏과 같이 유사한 제약 구조를 지닌 장면으로 무리 없이 확장될 수 있는지를 질적 비교를 통해 검증한다. 모든 비교는 동일한 작성 규칙과 실행 조건에서 수행되며, 결과 해석은 “어떠한 이유로 해당 출력이 도출되었는가”라는 설명 가능성과 전체 절차의 재현 가능성을 기준으로 한다. 따라서 본 장의 검토는 수치적 우열보다는 체계의 통제 가능성, 도메인 간 적용성, 시각적 산출물의 해석 가능성을 분명히 드러내는 데 목적을 둔다.
생성형 인공지능 기반의 디자인 설계 과제는 의미 해석의 다층성(Semantic complexity)을 필연적으로 수반하기 때문에, 단일 모듈 중심의 모델 아키텍처만으로는 복잡한 설계 요구를 충분히 반영하기 어렵다. 특히 가구 디자인은 구조적 논리성, 공간적 배치 규모, 시각적 스타일 속성이 유기적으로 결합된 고차원 설계 영역으로, 비정형 언어 표현(Fuzzy language)이나 비구조화된 시각 이미지로부터 실질적인 디자인 정보를 추출하는 과정이 시스템 구현 상의 주요 기술적 장애 요소로 작용한다.
이에 본 연구는 모델 구성 및 데이터 처리 측면에서 경량화된 구조(Light structure)와 모듈 간 밀접 연계(Strong coupling)를 동시에 확보하는 전략을 채택하였다. 이러한 접근은 모델 간 정보 흐름의 효율적 통합뿐만 아니라, 프롬프트 입력과 시각적 생성 결과 사이의 표현 제어 가능성(Control over expression)을 확보하는 데 중점을 둔다.
의미 분석 단계에서는 OpenAI에서 제안한 다중 모달 프레임워크 중 CLIP-ViT-L/14 모델을 기반으로 한 최적화 버전인 CLIP-GmP-ViT-L-14를 채택하였다. 해당 모델은 대규모 이미지-텍스트 병렬 학습 데이터셋을 기반으로 개념적 정합성과 추상적 의미 구조를 동시적으로 처리할 수 있는 특징을 지니며, 외형적 시각 요소(예: 실루엣, 색상 대비, 질감 정보)는 물론, 스타일 속성이나 공간 분류와 같은 내재적 의미 속성(Implicit semantic attributes)까지 효과적으로 추출할 수 있다는 장점이 있다.
또한, BLIP 모델의 자연어 생성 기능을 프롬프트 설계 초기 단계에 통합함으로써, 이미지나 설명적 텍스트로부터 구조적 맥락을 내포한 의미 단위(Segmental semantics)를 추출하고, 이를 기반으로 초기 프롬프트 초안을 자동 생성하는 체계를 구현하였다. 이 절차는 기존의 고정된 템플릿 기반 방식에 의존하지 않으며, 의미 필터링과 시각적 유사도 점수 기반의 선별 과정을 병행함으로써, 최소 프롬프트 단위 풀(Minimal prompt unit pool)을 구성하고, 이후 단계에서 프롬프트의 내용적 구성을 위한 기반 자료로 활용된다.
이미지 생성 단계에서는 Stable diffusion을 주요 생성 엔진으로 채택하였다. 이 단계의 핵심 목적은 곧바로 완성된 디자인 결과물을 도출하는 데 있지 않고, 프롬프트에 포함된 개념적 의미를 반영한 형태적 제약 조건을 부여함으로써, 스타일 방향성과 구조 논리성을 반영한 화이트 모델(White model) 이미지의 생성에 있다. 이 과정은 디자인 개념 탐색의 중간 산출물로 기능하며, 최종 설계 결정 이전의 아이디어 검증 자료로 활용될 수 있다.
나아가, 생성 이미지의 스타일 다양성과 공간 적합도를 제고하기 위해, 본 연구는 경량 교란 기법(Light perturbation mechanism)을 함께 도입하였다. 이 기법은 프롬프트 내 매개변수 값을 미세하게 변조함으로써, 전반적인 의미 일관성을 유지하면서도 시각적 스타일이 상이한 복수의 결과 이미지를 생성할 수 있게 하며, 이는 사용자 주관 평가 기반의 모델 선별 과정에서 유효한 비교 대상 데이터를 제공하는 역할을 한다.
3D 복원 단계에서는 기존의 “2차원 이미지 생성”과 “공간 기반 모델링” 간의 해석 단절을 해결하기 위해, NeRF(Neural Radiance Fields) 기반의 공간 역추론 모듈을 통합하였다. 이 모듈은 전통적인 3D CAD 또는 모델링 소프트웨어에 의존하지 않고, 생성된 2D 이미지 내 조명 조건, 투시 원근(Perspective) 및 카메라 파라미터 등 시각적 메타데이터를 분석하여, 평면 이미지를 스케일과 입체감이 부여된 3차원 화이트 모델로 변환한다.
해당 복원 결과는 향후 공간 구성 검증, 시나리오 삽입, 또는 인간-컴퓨터 상호작용 테스트(HCI)에 바로 적용 가능한 구조적 기반을 제공한다. 이는 곧, 프롬프트 기반 설계 언어가 실제 물리적 형태(Physicalized expression)로 전환되는 과정을 연결하는 중요한 인터페이스로 기능하며, 디자인 의미의 실재적 구현을 가능하게 한다.
데이터 구성 측면에서 본 연구는 가구 디자인에 특화된 고품질 3D 오픈소스 데이터셋 두 종류, ‘3D-FRONT’와 ‘3D-FUTURE’를 병행하여 활용하였다.
3D-FRONT는 다양한 시나리오에 따른 공간 배치 및 가구 배경 정보가 포함되어 있어, AI 기반 공간 감지 모델(Scene-awareness modeling) 학습을 위한 참조 기반을 제공한다.
반면 3D-FUTURE는 수천 개 이상의 고해상도 가구 모델을 포함하고 있으며, 각각에 대해 재질(Texture), 스타일 분류, 형상 특징 등의 정보가 어노테이션되어 있어, 스타일 기반 프롬프트 구성에 필요한 시각적 태그 정보(Visual annotation)를 안정적으로 제공한다.
이 두 가지 데이터셋의 통합 활용은 상호 보완적 기능을 수행한다. 3D-FRONT는 가구의 배치 원리를 다양한 공간 구성 조건 하에서 학습할 수 있는 기반을 제공하며, 3D-FUTURE는 스타일 중심의 프롬프트 구성에 필요한 명확하고 정제된 시각 정보를 뒷받침하는 역할을 수행한다.
데이터 전처리 단계에서는, 원본 데이터를 시스템의 입력 형식에 맞추어 재정렬하고, 어노테이션 기준의 통일화 및 의미 구조의 재편성(Semantic restructuring)을 진행하였다. 이 과정은 데이터를 단순한 보조 학습 자료로 취급하는 수준을 넘어서, 설계 생성 과정에서 모델 기능을 구성하는 핵심 요소로 전환하는 데 목적이 있었다.
전체적으로 본 연구에서 설계한 시스템은 ‘복잡성의 증가’보다는 ‘의미 흐름 간 연계 반응성’과 ‘스타일 표현의 안정성’을 우선하는 방향성을 취하였다. 즉, 모델 아키텍처는 복잡한 계산 구조보다는 의미 기반 연동(Logical coupling)을 중심으로 구성되었고, 데이터 계층에서는 구조화된 태그 라벨과 다중 시나리오를 포괄하는 범용성을 확보함으로써, 생성 논리의 신뢰성과 일관성을 뒷받침하였다.
이와 같은 시스템 통합 전략을 통해, 본 연구는 실제 디자인 수행 과정에서 생성–피드백–재조정의 순환 절차를 실행 가능하게 만들었으며, 다음 장에서 제시될 사례 분석(Case study)의 적용 기반으로 기능할 수 있는 구조적 프레임과 설계 데이터를 함께 마련하였다.
본 연구에서 제안한 생성형 가구 디자인 시스템은, 의미 기반 프롬프트의 정밀 구성을 최종 생성 결과물의 품질을 결정짓는 핵심 변수로 설정하였다. 특히 본 시스템은 프롬프트를 단순한 사용자 입력이나 고정된 텍스트 콜렉션에서 직접 호출하는 방식이 아닌, 이미지-언어 간 의미 구조를 심층적으로 해석하는 모델을 활용하여 시각 및 텍스트 정보를 해체하고, 그로부터 의미를 재구성하는 절차를 통해 프롬프트를 자동 생성하는 구조를 채택하였다.
이러한 의미 해석을 담당하는 전단부에서는 OpenAI가 개발한 CLIP-ViT-L-14 모델이 중심 엔진으로 활용되었다. CLIP(Contrastive Language-Image Pretraining)은 텍스트와 이미지 데이터를 동일한 벡터 임베딩 공간으로 매핑하는 크로스모달 대조 학습(Cross-modal contrastive learning) 방식에 기반한 대표적인 멀티모달 모델이다.
CLIP의 핵심 작동 원리는, 주어진 텍스트–이미지 쌍을 각각 벡터로 변환한 후, 의미적으로 일치하는 정 샘플(Positive pair) 간 유사도를 극대화하고, 무관한 부 샘플(Negative pair) 간 거리를 의도적으로 확장시킴으로써, 다양한 이미지-텍스트 관계에 대한 일반화 능력을 강화하는 데 있다.
기존의 전통적인 이미지 분류 네트워크들과 달리, CLIP은 사전에 정의된 레이블 체계에 의존하지 않고, 자연어의 내재적 의미 구성을 학습 대상으로 삼기 때문에, 스타일 해석이나 의미 추출과 같은 비정형 과제에서 보다 높은 정확도와 유연한 적용성을 발휘할 수 있는 장점을 갖는다. 이러한 특성은 프롬프트 설계와 시각적 정보 해석이 유기적으로 통합되는 생성형 가구 디자인 시스템에서 특히 유효하게 작용한다.
본 연구에서 활용된 GmP-ViT-L-14는 기존 CLIP 모델을 기반으로 구조적 경량화와 다중 모달 분포 최적화(Multimodal distribution optimization)를 거쳐 개선된 확장형 버전으로, Stable Diffusion 및 DALL⋅E 등과 같은 언어-시각 정보 결합 기반의 이미지 생성 모델에 최적화되어 있다. 기존 ViT-L/14 대비, GmP-ViT-L-14는 공간 단서(Spatial clues), 스타일 속성, 장식적 세부 표현이 포함된 이미지에 대해 더욱 고해상도 의미 벡터(Semantic vector)를 추출할 수 있으며, “매입형 수납”, “강한 색상 대비”, “경계 압축” 등과 같은 미세 속성 키워드(Attribute-level tokens)에 대한 응답 정확도와 인식 민감도가 향상된 특징을 가진다.
시스템 전체 작동 흐름에서 CLIP 계열 모델은 다음의 두 핵심 단계에 주요하게 참여한다.
첫째, 프롬프트 기초 분류 단계에서 CLIP은 BLIP 모델과의 연동을 통해 이미지 또는 텍스트 입력에 대해 다중 라운드 의미 파싱(Multi-pass semantic parsing)을 수행하며, 이를 통해 잠재적 키워드 그룹을 추출한 후, ‘기능(Functionality)–공간(Context)–스타일(Stylistic)’의 세 가지 범주로 1차 분류 체계를 구성한다.
둘째, 프롬프트 정제 단계에서는 CLIP의 의미 유사도 판별 메커니즘을 호출하여, 후보 프롬프트들과 참조 이미지 간의 의미 정합성(Semantic consistency)을 정량적으로 계산하고, 유사도가 기준 이하인 키워드를 자동으로 제거함으로써, 최종적으로 모델에 입력되는 프롬프트의 의미 정밀도를 보장하도록 설계하였다.
이와 같은 다층적 활용 방식은 CLIP-GmP-ViT-L-14가 단순한 표현 추출을 넘어, 프롬프트 구축의 의미 구조와 정보 선택 로직 전반을 제어하는 핵심 구성요소로 작용함을 보여준다.
주목해야 할 핵심은, 본 연구에서 CLIP 모델이 단순한 전통적 이미지 분류기(Image classifier)로 작동하는 것이 아니라, 프롬프트 구성 단계에서 언어 구조를 조율하는 ‘언어 생성 보조기(Language construction assistant)’로서 기능한다는 점이다.
CLIP은 사용자가 입력한 시각 장면 또는 서술적 텍스트에 내재된 공간 기능 구조와 스타일 선호 경향을 해석함으로써, 프롬프트 엔지니어링 과정의 구조 논리 정합성(Structural validity)과 의미 계층 구성(Semantic nesting)을 위한 기반 데이터를 제공한다. 이와 같은 역할은 CLIP이 단순히 이미지를 분류하거나 태그하는 수준을 넘어, 프롬프트의 설계적 논리를 구성하고 정제하는 과정에 실질적인 의미 구조를 부여함을 의미한다.
특히, CLIP 기반의 임베디드 의미 정렬 전략(Embedded semantic alignment strategy)은 시스템이 입력된 텍스트 및 이미지의 맥락을 더욱 정밀하게 이해할 수 있도록 돕는다. 이는 결과적으로, Stable diffusion 단계에서의 스타일 제어 명확성은 물론, NeRF 기반 3D 공간 재구성 과정에서의 조건 입력 정밀도를 향상시키는 데 기여한다.
본 연구는 AIGC 기반 가구 스타일링 설계 시스템의 실증 구현을 위해, 두 가지 주요 공개 데이터셋을 활용하였다. 사용된 데이터셋은 다음과 같다:
3D-FRONT (3D Furnished Rooms with Layouts and Semantics)
3D-FUTURE (3D Furniture Shape with Texture)
이들 데이터셋은 총 18,968건의 실내 공간 레이아웃 정보를 포함하고 있으며, 이는 완성된 가구 배치를 갖춘 형태로 구성되어 있다. 포함된 공간 유형은 침실, 거실, 주방, 욕실, 서재, 자동차 실내 공간 등 총 31가지에 이르며, 다양한 주거 유형을 포괄적으로 반영한다.
가구 모델의 경우, 총 13,151개의 고해상도 3D 모델로 구성되어 있으며, 각 모델은 전문 디자이너의 설계 결과를 기반으로 한 정밀한 기하학 형상 및 재질 텍스처 정보를 포함하고 있다.
또한, 주거 단위 스케일 기준으로 살펴볼 때, 전체 데이터셋은 약 60,000 세트의 실제 주택 레이아웃 설계를 기반으로 구축되었으며, 한 주택당 평균 6.5개의 공간 구성을 포함한다. 누적된 전체 공간 수는 44,427개에 달하며, 다양한 시나리오 기반의 공간 맥락 학습에 활용될 수 있다.
Fig. 2에 제시된 바와 같이, 본 시스템의 전체 아키텍처는 총 세 개의 계층적 모듈 구조로 설계되어 있다.
첫 번째 계층인 의미 해석 모듈은 자연어 입력으로 구성된 프롬프트를 세 가지 차원―구조(Structural), 기능(Functional), 스타일(Stylistic)―으로 분류하고, 이를 기반으로 시스템의 핵심 키워드 인식 성능(Keyword recognition capacity)을 향상시키는 역할을 수행한다.
두 번째 중간 계층에서는 CLIP-Interrogator가 중심적으로 작동하며, 텍스트와 이미지 간의 의미 통합 임베딩(Joint semantic embedding)을 수행한다. 이를 통해 언어적 표현과 시각적 정보 사이의 크로스모달 정렬(Cross-modal alignment)이 구현되며, 프롬프트 기반 명령과 시각 출력 간의 의미 일관성이 확보된다.
마지막 단계인 생성 모듈은 확산 기반 생성 메커니즘(Diffusion-based generation mechanism)을 적용하여, 앞선 프롬프트 해석 및 정렬 결과를 바탕으로 화이트 모델(White model) 형태의 3D 스케치 및 구조 이미지를 출력한다.
이와 같은 전체 절차는 “언어 정보 → 의미 구조화 → 시각적 형상화”로 이어지는 다층적 의미–형식 전이 구조(Multilayered semantic-to-form progression)를 보여주며, AIGC 기반의 디자인 시스템 내에서 언어와 시각 생성 간의 정합적 연계를 실현하는 핵심 경로로 기능한다.
본 연구에서는 CLIP과 BLIP 모델을 연동한 다단계 데이터 처리 체계를 적용하여, 이미지 기반 자연어 설명 및 프롬프트 선별 과정을 정밀하게 수행하였다.
우선, BLIP 모델은 입력된 시각 정보로부터 다양한 형태의 자연어 설명 후보군을 자동 생성하며, CLIP 모델은 해당 이미지와 각 설명 간의 의미적 유사도를 정량적으로 산출한다. 그 결과, 가장 높은 정합성을 보이는 문장을 선별하여, 이후 Stable Diffusion에 입력 가능한 프롬프트 구조(Prompt structure)로 전환하는 절차가 수행된다.
예를 들어, “라탄 재질의 릴렉스형 흔들의자”와 같은 이미지가 주어질 경우, CLIP Interrogator는 시각 속성에 기초하여 “수작업 편직 방식”, “천연 원목 프레임” 등의 상세 키워드를 포함한 고정밀 텍스트를 생성하며, 이 결과는 프롬프트 세분화 및 모델 파라미터 조정에 직접적으로 활용된다.
프롬프트 기반의 추론 과정은 “사용 시나리오–기능 요구–스타일 속성”의 삼중 구성 체계를 따르며, 프롬프트는 다음과 같은 형태로 구조화된다:
“수직 수납 시스템 + 광 반응형 색채 벽체 → 공간 활용도 극대화”
“협소한 현관 구조 + 접이식 신발 수납 벤치 + 모란디 색상 자석형 벽면 패널”
“개방형 사무 공간 + 높이 조절형 방음 파티션 + 픽셀 패턴의 모듈식 그린월”
3차원 모델 생성을 위한 공간 복원 단계에서는 NeRF-art 기반의 키워드 제약 조건 하에서 공간 재구성 기법이 적용된다. 더불어, Stable Diffusion 생성 프로세스에는 시나리오 기반 제약 모듈(Scene constraint module)이 포함되어 있으며, 출력 결과의 다양성과 표현 범위를 확장하기 위해 GAN 기반의 경량 교란 메커니즘(GAN-based light perturbation)도 병행하여 도입되었다.
Fig. 3은 본 시스템의 생성 과정에서 작동하는 상호작용 기반 최적화 구조를 도식화한 것이다. 이 메커니즘은 초기 프롬프트 입력을 통해 1차 시각 결과물을 생성한 뒤, 사용자 및 전문가 집단의 피드백 데이터를 기반으로 핵심 키워드 및 의미 흐름의 가중치 분포(Weight distribution)를 자동 조정하는 절차를 포함한다. 이를 통해 후속 이미지 생성 단계에서는 정확도 향상과 스타일 일관성 강화가 동시에 이루어지도록 설계되어 있다.
해당 피드백 기반 반복 구조는 단순히 시각 출력을 반복 생성하는 방식이 아니라, 시스템이 ‘의미 수정을 내재적으로 수행(Semantic correction capability)’할 수 있도록 구성된 고도화된 알고리즘 흐름을 따른다.
이 과정은 “언어 기반 입력 → 시각 생성 결과 → 외부 평가 → 정보 재입력”이라는 일련의 사이클을 중심으로 작동하며, 다단계 순환 최적화 루프(Multistage feedback loop)를 구성한다. 이러한 구조는 프롬프트 입력의 유연성과 생성 결과의 표현 정밀도를 지속적으로 보정함으로써, 최종적으로 사용자 의도의 정밀한 반영이라는 목적을 실현하는 데 기여한다.
본 연구는 재현 가능성과 개방성을 핵심 설계 원칙으로 설정하였다. 텍스트–이미지 생성 및 3D 복원 단계에서는 공개 모델의 기본 프리셋을 우선적으로 사용하며, 프롬프트 작성 규칙과 처리 절차를 체계적으로 문서화하였다. 모든 실험은 동일한 환경에서 수행되며, 모델 버전, 체크포인트, 토크나이저, 코드 커밋 해시 등의 정보를 명확히 기록한다. 또한 시드를 고정하고 전처리⋅후처리 과정을 최소화하여 설정 변화가 결과 해석에 영향을 미치지 않도록 하였다.
비교 실험은 동일한 프롬프트 슬롯 구조를 전제로 진행된다. 슬롯의 조합 방식, 키워드 대체, 교란 절차 적용 여부는 자동 로그에 기록되며, 프롬프트 확장 전후, 생성된 이미지, 3D 중간 결과 등 중간 산출물은 추적 가능성을 확보하기 위해 모두 보관한다. 개별 장면에 특수 규칙을 적용하거나 과도한 매개변수 조정을 하는 방식은 지양하며, 필요한 경우 부록에 예시 프롬프트, 실행 스크립트, 주요 파일 경로를 정리하여 제3자가 동일한 조건에서 재현할 수 있도록 하였다. 이러한 원칙은 가구 장면과 차량 콕핏 장면 모두에 일관되게 적용된다.
본 장에서는 가구 중심의 실내 환경을 대상으로 구축한 생성 프레임워크를 차량용 스마트 콕핏 영역으로 확장하는 논리적 근거를 우선적으로 제시한다. 두 환경 모두 제한된 체적 내에서 인체치수와 동작 범위를 전제로 설계가 이루어지며, 착좌 및 신체 접촉 인터페이스의 배치, 시선 위치와 가시각, 반사 및 글레어 처리와 같은 시각적 조건을 공통적으로 고려한다. 이러한 제약을 공유하는 상황에서는 형태⋅재질⋅연결 방식과 사용 맥락을 기술하는 프롬프트 슬롯이 도메인에 따라 달리 해석되지 않으며, 동일한 작성 원칙만으로도 설명의 일관성을 유지할 수 있다.
이에 따라 본 연구는 기능⋅형태⋅재질⋅스타일⋅맥락 등 핵심 슬롯 구조를 그대로 유지하면서, 콕핏 설계에 특화된 항목만을 최소한으로 추가하였다. 구체적으로 헤드업 디스플레이(Head-Up Display, HUD), 휴먼–머신 인터페이스(Human–Machine Interface, HMI), 통합형 암레스트와 같은 요소는 장면 제약을 변경하지 않고, 단지 차량 도메인의 특수성을 표현하기 위한 슬롯으로 활용된다. 데이터셋 또한 대시보드⋅도어 트림⋅센터 콘솔⋅시트 등 차량 실내 이미지를 포함하여, 가구 중심 장면과 자연스럽게 연속성을 가지도록 구성하였다. 따라서 본 논문에서 제시하는 콕핏 사례는 임의적 확장이 아니라, 동일한 제약을 전제로 하는 실내 환경 범주에서의 방법론적 일반화로 이해할 수 있다.
핵심 프롬프트 키워드: 주거 공간, 거주 시나리오, 스마트 맞춤형 설계, 공간 최적화, 소형 평면, 1인 주거 공간, 기능 모듈 통합, 콤팩트형 서재, 숨김형 게스트룸, 수직 공간 지능형 시스템, 책장-침대 일체형 구조, 동적 소재 적응 솔루션
핵심 프롬프트 키워드: 오피스 시나리오, 효율성 향상, 건강성 강화, 개방형 오피스 공간, 시각 협업 시스템, 동적 업무 환경, 고집중 연구 개발 존, 음성 간섭 저감, LED 벽면, 그린월, 음이온 농도 조절, 피로도 저감, 하이브리드 업무 환경
핵심 프롬프트 키워드: 부모-자녀 가정, 성장 기반 시나리오, 아동 행동 예측 모델, 동적 적응 솔루션, 영유아 단계(0–3세), 스마트 크롤링 매트, 압력 센서, 안전 활동 히트맵, 보호 펜스, EVA 완충 폼, 온도 감지 모듈, 학령기 단계, 자동 높이 조절 책상, 골격 발달 데이터
핵심 프롬프트 키워드: 자동차 공간, 운전 및 탑승 장면, 스마트 콕핏, L3+ 자율주행, 유연한 화면, 스마트 표면, 원활한 상호작용, 운전 정보의 정확한 표시, 운전 모드에 따른 분위기 조명 변화.
네 가지 상이한 유형의 디자인 시나리오에 적용된 실험 결과, 제안된 프롬프트 메커니즘은 스타일 톤 제어와 기능 요소 구현 측면에서 비교적 높은 수준의 제어력을 발휘하였다. 생성된 화이트 모델 역시 사전 설정된 디자인 목표와의 정합성이 우수하였으며, 전반적으로 의도된 설계 방향에 부합하는 시각적 결과물을 도출하는 데 성공하였다.
그러나 특정 복합 문맥이 개입된 사용 조건에서는, 생성된 결과와 실제 적용 환경 간의 세부적 불일치가 일부 확인되었다. 예를 들어, 프롬프트 조건을 시각적으로는 충족하였음에도 불구하고, 공간 스케일, 사용자 동선, 또는 사용 행태 측면에서 실질적인 부자연스러움이 나타난 사례가 존재하였다.
이러한 현상은, 구조화된 프롬프트 시스템이 생성 콘텐츠의 맥락 기반 적합성(Contextual fitness)을 온전히 보장하기에는 여전히 한계가 존재함을 시사한다. 따라서 향후 연구에서는 프롬프트 기반 생성 메커니즘이 실제 응용 환경에서 나타내는 문맥 불일치 사례에 대한 정량적⋅정성적 분석이 병행되어야 하며, 프롬프트 설계와 맥락 적응 간의 조율 가능성을 체계적으로 탐색할 필요가 있다.
네 가지 주요 시나리오를 대상으로 한 생성 실험 결과, 제안된 시스템은 스타일 제어 정확도와 프롬프트 의미 해석 능력 측면에서 전반적으로 안정적인 성능을 보였다. 특히 공간 배치 구조가 명확하게 정의되고, 프롬프트 문장이 구체적으로 기술된 과업에서는, 생성된 결과물이 설계 의도를 효과적으로 반영하는 경향이 도출되었다.
반면, 실험 과정에서는 시스템의 내용 이해 및 출력 정합성과 관련한 일부 한계점도 관찰되었다. 예를 들어, 시나리오 설명이 추상적이거나, 복합적인 기능 요구가 포함된 프롬프트의 경우, 모델의 출력 결과에서 의미 해석의 정확성 저하 및 디자인 표현의 부정확성이 동시에 나타나는 경향이 확인되었다. 이러한 현상은 생성 모델이 일정 수준의 시각 구성 능력을 확보하고 있음에도 불구하고, 여전히 실제 사용 맥락과의 간극, 즉 ‘의미 단절(Semantic disconnect)’이 존재함을 시사한다.
따라서 다음 절에서는 시스템이 실제 응용 환경에서 요구되는 문맥 반응 능력(Context adaptability)과, 다중 조건 입력에 따른 구조적 제약(Structural limitation)을 중심으로, 보다 정밀한 사례 분석과 해석을 통해 해당 문제들을 이론적 및 실증적으로 고찰하고자 한다.
본 연구에서 제안한 프롬프트 기반 생성 메커니즘은 다수의 적용 시나리오에서 스타일 반응성과 디자인 제어 가능성 측면에서 높은 수준의 성능을 보였다. 특히 스타일 속성이 명확하게 정의되고 기능 구조가 구체적으로 기술된 경우, 시스템이 생성한 결과물은 전반적으로 안정적인 구조 정합성과 시각적 일관성을 확보하는 경향을 나타냈다.
그러나 실제 사례 기반 실행 과정에서는 복합 맥락을 포함한 시나리오에서의 디자인 응답력 및 공간 해석 능력에 일정한 한계가 존재함이 확인되었으며, 의미 해석의 유연성 및 공간 적응성 측면에서도 추가적인 개선 가능성이 제기되었다.
예를 들어, 공간 구획이 비교적 명확하고 기능 분할이 구조적으로 선명한 환경―예컨대 1인 주거용 아파트나 개방형 사무실 공간(Open office)―에서는, 스타일의 조화성뿐 아니라 공간 비율을 반영한 가구 배치도 자연스럽게 형성되는 경향이 관찰되었다. 실제로, ‘책장-침대 통합형 유닛’이나 ‘매립형 게스트룸 모듈’과 같은 사례에서는 프롬프트의 의미 구조와 생성된 형상이 높은 수준의 정합성을 보였다.
반면, 프롬프트에 공간 비율, 사용자 동선, 또는 복합 기능 요구에 대한 정보가 충분히 명시되지 않을 경우, 생성된 결과물은 구조적 일관성이 떨어지거나 비례 왜곡이 발생하는 문제가 확인되었다. 특히 ‘상하 슬라이딩 파티션’, ‘접이식 다목적 테이블’ 등과 같이 공간 내 상호작용이 중요한 설계 요소의 경우, 생성 결과에 기능 분할이나 사용자 인터랙션 흐름이 충분히 반영되지 않는 사례가 반복적으로 나타났다.
이러한 문제 양상은 현재 시스템이 공간 중심 프롬프트에 포함된 맥락적 의미 정보(Contextual semantic cues)를 효과적으로 해석하는 수준에 여전히 제한이 있음을 보여준다. 더 나아가, 생성 결과는 자동화된 맥락 반응 메커니즘보다는 여전히 사용자의 사전 조건 설정에 강하게 의존하고 있음을 시사하며, 향후에는 프롬프트 기반의 문맥 인식 자동화 기능을 보완하는 방향으로 시스템 개선이 요구된다.
또한, 정서적 의미 전달(Emotional semantics) 측면에서도 생성 시스템의 한계가 일부 사례에서 관찰되었다. 예를 들어, ‘영유아 건강 모니터링 진료대’ 디자인 과제를 통해 분석한 결과, 시스템은 프롬프트에 포함된 “성장형 공간”, “안전 완충 소재” 등과 같은 개념어를 기반으로, 기능적 일관성과 형태적 정합성을 갖춘 출력 결과를 도출하는 데는 비교적 성공적인 성능을 보였다.
그러나 해당 결과는 기능 인식 및 물리적 대응 중심의 설계 수준에 머무르는 경향을 보였으며, 실질적인 사용 시나리오에서 요구되는 감정적 안정성, 공간 내 친밀감, 조작 과정에서의 심리적 편안함 등 정서 기반 상호작용 요소는 충분히 반영되지 못하는 한계가 확인되었다.
다시 말해, 시스템은 프롬프트에 포함된 명시적 언어 정보(Explicit linguistic cues)에 대한 해석과 전환에는 능숙하나, 섬세한 맥락 인식 및 정서 투사(Emotional projection) 차원에서는 상대적으로 제한된 반응만을 생성하는 것으로 나타났다.
이러한 ‘의미 정합성은 확보되었으나, 정서적 반응은 단절된 상태’는, 현재의 생성 모델이 사용자의 감정적 요구와 경험 기반 의도를 포착하고 반영하는 데 구조적 한계를 지니고 있으며, 여전히 기호적⋅기능 중심의 구성 논리에 편중되어 있음을 시사한다.
시스템의 작동 메커니즘 관점에서 본 연구는, 사용자 피드백 및 전문가 평가 결과를 프롬프트 최적화의 기준 변수로 활용하고자 하였으며, 이를 지원하기 위한 기본 피드백 흐름 구조를 구축하였다. 그러나 현재 구현된 피드백 경로는 주로 결과 생성 이후 후속 조정(Post-generation adjustment) 방식에 국한되어 있으며, 전체 작동 프로세스는 비실시간적이며 정적인 처리 흐름에 가까워, 실제적인 동적 협업 기반 생성(Dynamic co-creation) 단계에는 도달하지 못한 것으로 판단된다.
이는 시스템이 사용자 평가 정보를 기반으로 후속 출력의 방향성을 일부 조정할 수는 있으나, 생성 과정 중에 사용자의 의도 변화나 다중 의미 선택에 대한 실시간 반영 기능은 아직 충분히 구현되지 않았음을 의미한다. 특히, 스타일 취향이 복잡하거나 기능 요구가 다층적으로 구성된 디자인 시나리오, 또는 사용자 의도가 불명확하게 입력된 초기 단계 프롬프트의 경우, 시스템은 사용자의 중간 피드백을 즉각 반영하거나 프롬프트 구조를 실시간으로 수정하는 데 제한적인 반응성을 보였다.
이와 같은 실시간 상호작용(Interactive responsiveness)의 결여는, 생성 시스템이 고도화된 인간–기계 협업 기반 창작 환경으로 발전하는 데 있어 중요한 제약 요소로 작용하고 있으며, 향후에는 생성 중 인터랙티브 피드백 통합 및 프롬프트 재구성 능력을 강화하는 방향으로 시스템 구조 개선이 요구된다.
끝으로, 스타일 표현의 다양성 측면에서 본 시스템의 생성 성능을 검토한 결과, ‘북유럽풍’, ‘모던’, ‘중식’ 등과 같이 전통적이고 구조화된 스타일 계열에서는 비교적 높은 수준의 일관성과 스타일 식별력(Style distinctiveness)을 확보하는 것으로 나타났다. 이와 같은 경우, 생성 결과는 학습 데이터와의 정합성(Consistency)이 높고, 시각적 완성도 또한 안정적으로 유지되는 경향을 보였다.
반면, ‘픽셀풍 식물벽’, ‘다조성 하이브리드 서재’와 같이 스타일 경계가 비선형적이며 창의적 조합이 요구되는 디자인 과제에 직면한 경우, 시스템은 보수적인 시각 표현에 머무르거나, 유사한 구성 요소가 반복되는 등 출력 다양성의 제약이 두드러지게 나타났다. 특히, 스타일 혼합에 기반한 실험적 시각 언어를 요구하는 과업에서는, 독창적인 형태나 구조 조합을 효과적으로 생성하지 못하는 경우가 빈번하게 확인되었다.
이러한 결과는 현재 모델이 학습한 스타일 데이터의 분포가 주류 사례 중심으로 편중되어 있으며, 비주류 또는 신흥 스타일 유형에 대한 학습 포착력(Style generalization capacity)이 상대적으로 제한적임을 시사한다. 아울러, 프롬프트 메커니즘 자체도 비선형적 스타일 의미 구조를 처리하는 데 있어 유연한 조합 호출(Flexible combinatorial retrieval) 기능이 부족하며, 스타일 경계가 불분명한 상황에서는 창의적 시각 표현을 유도하는 데 구조적 한계를 보이고 있다.
정리하면, 본 연구에서 제안한 ‘프롬프트-모델-화이트모델’ 간의 언어-형태 전환 체계는, 자연어 입력과 시각적 결과물 출력 사이의 연결 효율성을 일정 수준 향상시켰다는 점에서 의미 있는 진전을 이룬 것으로 평가된다. 이와 같은 구조는 생성형 인공지능 기반 디자인 지원 시스템의 기반 요소로서 개념-생성 간의 순환 경로를 구체화하였다는 데 의의가 있다.
그러나 일련의 실험적 사례 분석을 통해, 본 시스템은 여전히 공간 인식 정확성, 정서 반응 능력, 실시간 상호작용성, 스타일 다양성 수용력 등 여러 측면에서 개선 가능성이 존재함이 확인되었다. 이는 현재의 생성 메커니즘이 실제 디자인 실무의 다차원 맥락성에 충분히 대응하기에는 구조적으로 미흡한 부분이 있음을 시사한다.
따라서 향후 시스템의 고도화를 위해서는, ▲프롬프트 표현 구조의 의미 진화 전략(Semantic evolution strategy) 수립, ▲언어–시각 간 크로스모달 연산 구조의 확장, ▲사용자 상호작용 경로와의 실시간 협업 메커니즘 구축 등이 종합적으로 논의되어야 할 것이다. 이러한 구조적 기반이 확보될 경우, 생성형 인공지능 시스템은 기존의 ‘정적 출력 중심의 도구’에서 벗어나, 의미 중심의 협력형 창작 인터페이스로 진화할 수 있으며, 이는 복합적 디자인 과업에서 디자이너의 창의적 탐색과 설계 실행을 유연하게 지원하는 실질적 수단으로 기능할 수 있을 것이다.
다음 장에서는 본 연구의 주요 단계별 성과를 요약하고, 향후 실무적 적용 가능성과 후속 연구 방향에 대해 보다 체계적으로 제안하고자 한다.
최근 프롬프트 엔지니어링에 대한 논의는 개념적 정의와 이론적 틀의 정립 측면에서 일정한 진척이 있었으나, 수치 기반의 평가 체계 구축이나 복합적 상황 속에서의 실질적 활용 가능성에 대한 논의는 아직 초기 단계에 머물러 있다. 가구 디자인 분야는 창의적 사고와 실용적 요구가 교차하는 설계의 장으로서, 생성형 인공지능과의 깊이 있는 연계를 실험하기에 적합한 대상 영역으로 평가된다. 특히, 기능 중심의 디자인 아이디어와 멀티모달 AI 모델의 융합은 ‘AI 중심 설계 인터페이스’와 ‘디자인 혁신 프로세스’ 간의 협력 구조를 모색할 수 있는 이론적⋅실천적 토대를 마련해준다.
본 논문은 프롬프트 기반 설계 가능성을 중심으로 검토하였으나, 다음과 같은 제약을 동반한다. 기존 연구 대다수가 문헌 정리 및 오픈소스 시스템의 기능 복원에 초점을 맞춘 결과, 프롬프트 구성 방식이 결과물 생성에 미치는 영향에 대한 정량적 검증은 상대적으로 부족하였다. 본 연구 역시 제한된 조건 하에서의 사례 기반 분석에 의존하였으며, 다양한 사용자 시나리오나 공간 배치 및 디자인 환경을 포괄하는 확장된 실증 분석은 차기 연구로 이월되었다.
향후 연구는 두 가지 방향에서의 심화가 필요하다. 첫째, 프롬프트 구조의 의미적 해석과 생성된 산출물의 창의성 수준 사이의 연관성을 계층적으로 규명할 수 있는 과학적 검토 기준이 요구되며, 이를 통해 프롬프트가 단순한 입력값이 아니라 설계의 질에 작용하는 주요 매개 요소로 기능함을 입증할 수 있어야 한다. 둘째, 실무 적용 가능성을 제고하기 위해 ‘기능–재료–구조–형태’ 등 핵심 설계 요소들을 통합한 다차원적 데이터 구조가 필요하며, 이러한 정보는 해석 가능한 의미 체계로 전환되어야 한다. 이를 통해 AI는 사용자의 설계 목적을 보다 정밀하게 이해하고, 실질적 생성으로 이어지는 설계 도구로 활용될 수 있다.
결론적으로, 본 연구에서 제안한 통합적 접근법은 프롬프트 기반 설계의 실험적 타당성을 뒷받침함과 동시에, 직관 중심으로 이루어졌던 가구 디자인 실천이 데이터 기반의 지능형 설계 체계로 전환되는 데 필요한 이론적 근거와 실무적 경로를 제시했다는 점에서 학술적 의미를 갖는다.
본 연구는 가구 디자인을 실험적 적용 대상으로 삼아, “생성형 인공지능을 활용하여 조정 가능성과 환경 적응성을 포함하는 3차원 생성 메커니즘을 어떻게 구축할 수 있는가”에 대한 해답을 모색하였다. 이를 위하여 기존의 단순 명령형 입력 방식(Prompt)을 설계 언어와 생성 알고리즘 간의 매개 규칙 체계로 재개념화하고, 텍스트–이미지–3D 재구성으로 이어지는 언어 기반 생성 경로(Language-driven generative process)를 체계화하였다.
첫째, 프롬프트를 단순 지시어가 아닌 개념 구성 도구로 해석하고, 기능(Function)–공간(Context)–스타일(Style)의 3단계 계층 구조 슬롯을 구성하여 키워드 간 충돌 및 의미 모호성을 감소시켰다. 이와 같은 구조화 전략은 생성 모델의 반응 논리를 언어적 규칙에 기반해 설명할 수 있도록 하며, 입력 정보의 변화가 출력 결과에 미치는 영향을 명료하게 추적할 수 있게 한다.
둘째, BLIP 및 CLIP 알고리즘을 활용한 의미 정렬 기법과 함께, 공출현 빈도 및 의미 유사도를 고려한 필터링 절차를 결합함으로써 프롬프트의 구성 요소를 시각적 근거와 연계하였다. 이 과정은 입력 정보의 정확성과 의미적 일관성을 동시에 확보하여, 생성 결과물과의 논리적 연계성을 향상시키는 데 기여하였다.
셋째, 설계 과정 중 빈번히 발생하는 의미 단절 현상(Semantic disconnect)에 대응하기 위한 보완 절차를 제안하였다. 계층형 슬롯 구조와 의미 정렬 기법을 적용함으로써 표현 범위를 일정 수준으로 조절하면서도 생성의 다양성과 유연성을 확보하였으며, 이는 향후 인간–AI 협업 기반 설계로의 확장 가능성을 제시하는 개념적 토대를 제공한다.
결론적으로, 본 연구는 프롬프트를 중심에 둔 설계 언어, 생성 알고리즘, 그리고 3차원 시각 재구성 간의 통합적 연계 구조를 구축함으로써, 가구 디자인 맥락에서 통제 가능성, 확장성, 해석 가능성을 갖춘 생성형 설계 프레임워크를 제안하였다.
디자인 실무는 데이터 기반 접근과 인공지능 기술의 발전이라는 변화 속에서, 생성형 인공지능과의 통합적 적용 가능성이 중요하게 부각되고 있다. 특히, 공간의 제약이 두드러지는 가구 설계 분야에서는 미적 요소를 넘어서 기능적 타당성, 인체공학 기준, 주거 환경과의 적합성 등 다차원적 요건이 동시에 충족되어야 한다. 이에 본 연구에서는 프롬프트 기반의 생성 메커니즘을 통해, 기존 CAD 위주의 모델링 방식이나 자유 형태 스케치에서 나타나는 초기 설계 결정의 불확실성과 자동화 범주의 한계를 보완하는 실행 가능한 방안을 제시한다.
첫째, 본 시스템은 개념 설계 단계에서 지능형 설계 보조 도구로 기능하며, 사용자가 자연어를 통해 공간적 조건과 사용자 요구 사항을 기술하면, 해당 정보를 구조화된 프롬프트 집합(Prompt group)으로 전환하여, 초기 형태인 화이트 모델(White model)을 신속하게 생성한다. 이와 같은 과정은 반복적인 오류 수정 과정을 감소시키고, 디자이너가 조형 조정 및 의미 부여에 집중할 수 있는 설계 흐름을 유도한다. 특히 초기 단계에서 목표 지향이나 스타일 설정이 불분명할 경우, 시스템이 제공하는 스타일 변이안(Style variation)은 실질적인 시각적 참고 자료로 활용되어 의사결정을 지원한다.
둘째, 제안된 시스템은 협업 과정에서의 설계 정보 전달을 보다 명확하게 만든다. 프롬프트 구성 원칙과 각 단계별 생성 결과가 문서화됨으로써, 설계자의 의도를 텍스트 기반으로 공유할 수 있으며, 시지각 요소나 인체공학적 제한을 반영한 사전 검토가 가능해진다. 이러한 특성은 디자이너, 비전문 사용자, 기술 엔지니어 간의 커뮤니케이션을 매개하며, 반복적 설계 생성과 비용 효율적 대응을 가능하게 한다.
셋째, 본 시스템은 플랫폼, 교육, 연구 기반 인프라와의 통합 가능성이 높다는 점에서 확장성이 뛰어나다. 본 연구에서 제안한 ‘프롬프트–생성 모델’의 연계 구조는 전자상거래, 맞춤형 가구 제작, 인터랙티브 BIM 환경 등에 융합될 수 있으며, 이는 사용자, 인공지능, 디자이너 간의 협력적 인터페이스로서의 활용 가능성을 시사한다. 특히 교육 분야에서는 형식적 지식 전달을 넘어서, 언어와 시각 요소가 결합된 의미 중심의 설계적 사고를 훈련할 수 있는 교육 도구로 기능할 수 있다. 더불어, 프롬프트 언어(Prompt language)를 공통 매개체로 활용함으로써, 건축, 실내디자인, 산업디자인 등 다양한 분야 간 협업에서 개념적 정확성과 상호 이해도를 증진시키는 데 기여할 수 있다.
끝으로, 본 연구의 체계는 기존의 정량 중심 평가 방식에서 벗어나 표현 구조 중심의 설계 시스템(Expression-structured system)으로의 전환을 목표로 한다. 현재는 실험적 단계에 머물러 있으나, 향후 실제 설계 과정, 디지털 플랫폼, 교육 과정 등 다양한 활용 문맥에서 적용 가능성이 높으며, 이식성과 확장성을 갖춘 실용적 프레임워크로서의 잠재력을 지닌다.
본 연구는 프롬프트 설계 방식, 다중모달 생성 절차, 그리고 3D 공간 복원까지 포괄하는 일련의 과정을 하나의 흐름으로 제시하고, 사용자와 전문가의 의견을 반영하여 제안 방법의 일부 실효성을 검증하였다. 그러나 해당 체계를 보다 넓은 맥락에 적용하기 위해서는 △의미 진화에 대한 체계적 모델링, △스타일 표현의 매개변수화, △상호작용 구조의 내재화라는 세 가지 축에서 심화 연구가 요구된다.
첫째, 의미 진화 모델링의 고도화가 필요하다. 현재 시스템은 기능⋅공간⋅스타일 슬롯에 가중치를 배분하는 정적 조합을 중심으로 작동하지만, 생성 과정에서 축적되는 반응과 피드백을 반영하여 프롬프트를 동적으로 재구성하는 능력은 제한적이다. 후속 연구에서는 프롬프트 간 의미적 연계와 변화를 추적하는 관계 그래프를 도입하고, 세션 단위로 입력⋅산출물⋅외부 변동의 차이를 기록함으로써 구조적 갱신이 가능한 느슨한 연결망 형태로 확장할 계획이다. 이 과정에서 재현성 확보를 위해 갱신 정책과 버전 고정 지점을 병행하여 비교 가능성과 적응성을 동시에 보장한다.
둘째, 스타일 표현의 매개변수화이다. 현재 체계는 보편적 양식에는 안정적으로 대응하지만, 비정형적이거나 복합적인 양식에서는 공간적 일관성이나 형상 논리가 약화되는 사례가 나타난다. 이를 보완하기 위해 스타일 속성을 고차원 임베딩 공간에 배치한 후, 재질⋅비율⋅형태⋅장식 등 세부 요소로 분해하여 조정 가능한 파라미터로 환원한다. 탐색 과정은 구조 보존을 기본 조건으로 설정하고, 다양한 양식 간의 미묘한 차이와 조합 가능성을 점진적으로 학습⋅제어하는 절차를 마련한다.
셋째, 상호작용의 내재화가 요구된다. 현재와 같이 단일 입력과 사후 피드백에 의존하는 방식에서 벗어나, 언어⋅제스처⋅시선 등 다중모달 신호를 실시간으로 프롬프트 구조와 연동시키는 단계적 합의 기반 생성 방식으로 전환한다. 이를 위해 슬롯 상태와 제약 조건을 시각화하는 인터페이스, 중간 산출물의 단계별 비교⋅고정 기능, 세션의 로그화 기능을 마련하여 사용자 반응에 따라 생성 경로가 유연하게 조정되는 공동 창작(Co-creative) 체계를 구현한다.
종합하면, 향후 발전 방향은 단순한 성능 향상을 넘어 체계의 개방성, 의미 제어의 정밀성, 실제 설계 맥락에 대한 적응력을 아우르는 방향으로 설정되어야 한다. 이러한 기반이 마련될 때, 제안한 시스템은 단순한 생성 도구를 넘어 디자이너의 사고를 보조하고 문제 해결을 지원하는 협력적 파트너로 자리매김할 수 있을 것이다.
| 1. | J. Y. Kim and H. S. Lee, “Application of Generative AI in Product Design: A Case Study on Furniture Customization,” Journal of the Korean Society of Design Culture, Vol.28, No.3, pp.45-56, 2022. |
| 2. | S. H. Park and Y. J. Choi, “AI-Driven Design Innovation: Trends and Challenges in Industrial Design,” Korean Journal of Industrial Design, Vol.19, No.2, pp.33-42, 2021. |
| 3. | D. H. Lee and M. J. Kim, “Advancements in Generative Adversarial Networks for 3D Model Generation in Design Applications,” Journal of the Korean Society for Precision Engineering, Vol.40, No.5, pp.321-330, 2023. |
| 4. | H. J. Choi and J. W. Park, “Multimodal Learning with CLIP for Design-Oriented Image-Text Alignment,” Journal of the Korea Contents Association, Vol.22, No.7, pp.112-123, 2022. |
| 5. | S. W. Kim and Y. S. Oh, “Prompt Engineering for Generative Design: Optimizing Text Inputs for AI-Driven Creativity,” Journal of the Korean Society of Design Science, Vol.36, No.4, pp.87-98, 2023. |
| 6. | Y. M. Cho and H. R. Kim, “Prompt-Based AI for Spatial Optimization in Compact Residential Interiors,” Journal of the Korean Institute of Interior Design, Vol.31, No.2, pp.67-78, 2022. |
| 7. | S. J. Lee and J. H. Park, “Prompt Engineering for Ergonomic Furniture Design in Office Environments,” Journal of the Ergonomics Society of Korea, Vol.42, No.1, pp.45-56, 2023. |
| 8. | M. J. Kang and S. Y. Oh, “User-Centric Prompt Engineering for AI-Driven Furniture Design,” Journal of the Korean Society of Design Culture, Vol.28, No.4, pp.89-102, 2022. |