The Korean Society Of Automotive Engineers
[ Article ]
Transactions of the Korean Society of Automotive Engineers - Vol. 33, No. 2, pp.99-108
ISSN: 1225-6382 (Print) 2234-0149 (Online)
Print publication date 01 Feb 2025
Received 06 Aug 2024 Revised 06 Aug 2024 Accepted 09 Sep 2024
DOI: https://doi.org/10.7467/KSAE.2025.33.2.99

인공지능 플랫폼을 활용한 창의적 차체 형태 생성

구상*
홍익대학교 산업디자인학과
Generating Creative Body Shapes with AI-Platforms
Sang Koo*
Department of Industrial Design, Hongik University, Seoul 04066, Korea

Correspondence to: *E-mail: koosang@hongik.ac.kr

Copyright Ⓒ 2025 KSAE / 231-01
This is an Open-Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License(http://creativecommons.org/licenses/by-nc/3.0) which permits unrestricted non-commercial use, distribution, and reproduction in any medium provided the original work is properly cited.

Abstract

This study is purposed to get implications for design method with AI-plat forms by reviewing generated automobile body design images by AI reflecting the results of the two advance studies. The study started with analysis of generated shape images by corpus with the abstract shape characteristics which have ideological characteristics rather than visual. The shape image and its characteristics generated by the corpus had been executed to verify influences of corpora for novel shape creation with changes of text prompts. The implication for AI-flat form based novel shapes creation methodology in developing automobile body designs are as follows; AI-flat form based generated images might have advantages in broadening limits of perception of designers, also work as catalyst for enhancing creativity. For the AI-flat form based image generating may work as a starting point for a creative design process with this reason, still has limit for developing to holistic works though.

Keywords:

AI-Plat form, Body shape design, Script, Corpus, Image prompt, Parameter

키워드:

인공지능 플랫폼, 차체 형태 조형, 명령어, 말뭉치, 이미지 프롬프트, 매개변수

1. 서 론

인공지능(AI; Artificial Intelligence)으로 구동되는 플랫폼을 활용한 조형 방법론에 관한 첫 번째 선행연구1)와 그를 반영한 두 번째 선행연구2)에서 이미지 생성의 통제적 방법의 시사점을 탐구하였다. 이를 통해 인공지능 플랫폼을 활용한 이미지 생성에서 말뭉치 개념의 코퍼스(Corpus) 활용과 그 내용 구성의 적절성이 이미지 생성을 변화시키는 통제적 방법임을 알 수 있었다.

인공지능 플랫폼 「미드저니(Midjourney)」는 이미지 프롬프트(Image prompt), 텍스트 프롬프트(Text prompt), 매개변수(Parameters) 등의 세 부분의 명령어 구조로 되어 있으며, 각 특성에 맞는 어휘의 입력이 요구된다. 그리고 이를 위해 서술형 용어(敍述形 用語; Descriptive words), 지정형 용어(指定形 用語; Designative words) 등으로 구분해 활용할 수 있음을 확인하였다.

이러한 선행연구를 통해 전체적으로는 정량적(定量的; Quantitative) 개념보다 정성적(定性的; Qualitative) 개념의 어휘와 조형의 연합으로 생성되는 인공지능 플랫폼의 결과물이 디자이너의 초기조형 작업에서 창의성을 고무시키는 수단으로 활용될 수도 있다는 시사점을 얻을 수 있었다.

실제의 창의적 사고 활동에서는 논리적 사고와 이성적 판단이 오히려 제약으로 작용하기도 하므로 그것이 배제된 결과물을 보여주는 인공지능 플랫폼을 활용해 생성된 이미지를 고찰한다면, 그것을 활용한 창의적 발상 범위의 확장도 가능할 것이라고 추론할 수 있다.

따라서 본 논문에서는 텍스트 입력에 의한 이미지 생성 결과물을 제공하는 인공지능 플랫폼에서 명령어 서술 형식의 프롬프트 어휘의 사용에 관한 선행연구에서 도출된 방법론을 마무리하는 연구로써 인공지능 플랫폼에서 생성한 이미지 사례 고찰을 통해서 생성 이미지의 통제력 향상 방안을 탐색하고자 한다. 이에 따른 본 논문의 연구 내용은 다음의 세 가지로 요약할 수 있다.

  • ⋅생성형 AI에서 요구되는 정보
  • ⋅조형 생성을 위한 언어 도구의 유형
  • ⋅창의적 조형 작업에서 명령어 구성 유형

2. 인공지능과 명령어

2.1 인공지능 도구와 명령어

인공지능 플랫폼 「미드저니」의 입력 방법 등은 첫 번째 선행연구에서 고찰한 바 있는 「닥스 미드저니(https:// docs.midjourney.com/)」 웹 사이트의 내용3)을 중심으로 정리할 수 있다. 프롬프트의 구성은 베이직 프롬프트(Basic prompts)와 어드밴스드 프롬프트(Advanced prompts)로 구분되며, 중심이 되는 개념은 단어의 선택, 단수와 복수, 내용의 구성과 길이 등의 변화에 의한 통제력(Control) 변화를 활용함으로써 좋은 결과의 개연성이 있음을 알 수 있었다. 주요 네 가지 내용을 요약한 것이 Table 1이다.

Explanations of prompting notes

프롬프트에서는 단어의 선택이 중요한 요인이며, 다양한 상황에서는 더 구체적인 동의어(同義語)가 더 잘 작동한다는 설명을 볼 수 있다. 또한 큰 개념보다는 작은 것에서 점차로 크게 확대해나가는 형식이 유효하다고 설명하고 있다. 복수형 단어는 인공지능 플랫폼이 생성하는 이미지의 우연성(Chance)의 요인이므로, 특정한 숫자를 사용하는 것이 더 구체적 결과로 나타난다고 설명하고 있다. 예를 들어 “새(Birds)” 대신 “새 떼(Flock of birds)” 등의 집합명사 사용을 권장하고 있다. 그리고 표현되기를 원하는 것을 설명할 것을 권장한다. 따라서 어떤 객체가 최종 이미지에 포함되지 않기를 확인하려면 매개변수 「--no」의 사용해야 한다고 권장하고 있다.

프롬프트의 길이나 세부 정보에 관한 설명에서는 간단할 것을 권한다. 짧은 프롬프트는 「미드저니」의 기본 형식이므로, 오히려 지정되지 않은 세부 사항이 창의적으로 생성될 수 있기 때문이다. 이는 프롬프트에 거시적 요소를 포함하는 것이 중요하며, 세부 사항이 적을수록 다양성은 높아지며, 의도한 바를 정확히 얻기 위한 통제력은 줄어든다1)고 설명하고 있다.

명령어와 관련한 내용은 종합적으로는 정성적 용어와 정량적 용어, 혹은 서술형 용어 (敍述形 用語; Descriptive words), 지정형 용어(指定形 用語; Designative words) 등으로 구분될 수 있다. 생성 이미지가 제시되는 「미드저니」의 작업 공간 화면 구성에서 생성된 이미지 번호와 생성 및 재생성 버튼의 구성은 Fig. 1과 같다.

Fig. 1

Explanation for numbers of generated images and execution buttons on the screen

2.2 이미지 생성 명령어 형식

어드밴스드 프롬프트의 구성요소인 이미지 프롬프트(Image prompt), 텍스트 프롬프트(Text prompt), 매개변수(Parameters)의 세 부분으로 구성된 명령어 특성에 맞는 형식의 내용을 정리한 것이 Table 2이다.

Formats and category of prompts

어드밴스드 프롬프트 구성요소에서 마지막의 매개변수는 정량적 특성, 또는 지정되는 형식과 연결된다. 매개변수의 주요 유형은 Table 3의 주요한 사례와 같이 정리할 수 있다.

Examples of parameters used in Midjourney

이들 내용 중 예를 들어 「--ar 3:1」은 생성되는 이미지의 가로세로 비율을 3:1로 지정하는 명령어로, 이 수치의 변화를 통해 화면 비율을 16:9 등으로 다양하게 바꿀 수 있다. 「--nijii」는 생성되는 이미지를 일본 애니메이션과 같은 인상의 이미지로 만들어주는 것이며, 「--s100」은 미드저니 자체의 예술성을 더해주는 명령어로, 0에서 100까지 변화시킬 수 있고, 기본값은 100이다. 「--v」는 미드저니 플랫폼 버전을 지정해 주는 명령어인데, 각 버전은 고유의 특성이 있다고 알려져 있다. 또한, 「--w 300」 등의 명령어는 특이함을 더해주는 명령어로, 3,000까지 설정할 수 있고, 기본값은 0이다. 「--c」는 초기에 생성되는 4개 이미지의 다양성을 의미하며, 기본값은 0이지만, 100이 최대치이다.

2.3 코퍼스와 이미지 고찰

인공지능 플랫폼을 활용한 조형을 위한 명령어는 말뭉치 또는 코퍼스(복수형: Corpora)의 형식이 유효함을 선행연구를 통해 확인할 수 있었다. 여기에서 코퍼스는 자연언어 연구를 위해 특정 목적을 가지고 언어 표본을 추출한 집합을 의미4)한다. 이러한 코퍼스의 분석은 최근의 컴퓨터 연산 속도의 향상으로 더 발전했으며, 확률이나 통계적 기법, 시계열적 접근 등으로 전체를 파악한다.

말뭉치는 말뭉치 언어학(Corpus Linguistics) 분야에서 주요 지식의 기반이며, 다양한 형태의 말뭉치를 분석하고 처리하는 것은 품사 표기 및 다른 목적을 위하여 「은닉 마르코프 모델(Hidden Markov Model, HMM)」을 만들어 사용하는 전산언어학, 음성 인식, 기계 번역 분야의 연구 대상2)이기도 함을 볼 수 있었다.

코퍼스는 세부를 묘사하며 생성되는 이미지의 통제력을 높이는 요소로 활용될 수 있으며, 이 개념을 인공지능 플랫폼에서 활용하는 방법은 말뭉치의 영역을 정하고, 그것을 콜론(:)으로 연결하는 형식이 사용된다. 선행연구에서 제시했던 이미지 Fig. 2를 다시 살펴보면, 이를 생성하는 프롬프트는 「The appearance of a car: 29 % of length of hood. Fast back body 2 door coupe. Material: transparent glass. Shape of body: aerodynamic body. Function: high speed driving. Glossy: the shape surface has a glossy feel. Surface color: Italian red. --ar 3:1」이었다. 그리고 여기에 사용된 말뭉치를 유형 별로 정리한 것이 Table 4이다.

Fig. 2

Generated images of coupe by Midjourney flat form, 2024-07-26-13:34

Prompt analysis for Fig. 2

이 사례에서는 생성되는 화면 비율을 3:1로 지정했으나 차량 이미지에서 완전한 측면 뷰(Normal side view)와 후측면 뷰(Rear quarter view)와 전측면 뷰(Front quarter view)가 혼재하는 결과를 보여준다. 그리고 광택이 있는 차체 이미지에서 차체 색상은 본래 명령어의 이탈리안 레드(Italian red) 색상과 달리 Fig. 2에서와 같이 명도와 채도가 낮은 색상으로 생성된 이미지를 보여준다.


3. 조형 명령어의 생성 고찰

3.1 조형 구성 명령어

인공지능 플랫폼을 활용한 조형의 응용을 보편적인 차체 디자인의 조형 작업을 기준으로 한다면, 주요 키워드는 조형성, 대칭성, 형태 연속성, 광택, 부피, 재질감, 기능성, 촉감, 형태 유동성, 차별성, 시각적 인상 등으로 구분할 수 있다. 그 내용을 정리한 것이 Table 5이다. 이러한 특성은 제품이나 차량 등 디자인 대상의 분야별로 거시적으로는 유사할 것으로 보이나, 세부에서는 차이를 보일 수도 있다.

Corpora for image prompts

3.2 조형 구성 명령어에 의한 이미지 생성

Table 5에서 정리한 조형 구성 명령어를 인공지능 플랫폼에 입력해 이미지로 생성시키는 작업을 통해 이미지를 학습시키는 것과 생성을 병행하였다. 실행한 시점은 2024년 7월 31일 오전 11:30부터 14:30분까지 약 세 시간이었다. 이들 이미지 중 일부는 재실행으로 인해 초기에 생성된 이미지에서 변화된 것도 있었다. 생성 이미지와 그를 위한 프롬프트를 정리한 것이 Table 6이다.

Generated images from the image prompts

3장 1절의 Table 5에서 정리한 열두 가지 항목의 말뭉치를 이미지 프롬프트로 활용하고 매개변수는 3:1의 화면 비율로 지정해 생성된 다양한 추상적 이미지를 Table 6에서 볼 수 있다. 생성된 이들 이미지는 모두 물리적으로 구현된 형태를 보여주지만. 그 특성에서는 추상성도 동시에 가진 것도 있다.

3.3 조형 특성 명령어

3장의 1절과 2절에서 서술한 내용의 특성이 대부분 전체적(全體的; Wholistic)이고 구상적(具象的; Figurative)이라고 한다면, Table 7에서 구체화된 서술로 생성한 이미지는 상대적으로 추상적(抽象的; Abstract)이고 관념적(觀念的; Ideological) 특성, 또는 세부의 특징을 묘사하는 성격의 명령어라고 할 수 있다. Table 7은 각 특성과 그 특징을 서술한 내용을 정리한 것이다.

Corpora for shape characteristics

3.4 조형 특성 명령어에 의한 생성 이미지

Table 8은 각 특성과 그 가시적 이미지를 정리한 것으로, 조형체 자체의 조성을 통해 감성적 특징을 변화시키는 역할을 한다. 한편, 생성형 이미지에서는 비구상적 요인도 가시화시켜준다는 점에서 그 특징을 볼 수 있다.

Corpora for shape characteristics descriptions


4. 차체 조형의 창의적 생성 시도

4.1 차체와 조형 특성

본 장에서는 인공지능 플랫폼을 활용한 차체 조형의 생성 고찰에서 보편적 쿠페형 승용차의 조형을 기준으로 고찰하기 위해, 선행연구 논문에서 생성했던 이미지5)와의 비교를 위해 같은 조건의 이미지 프롬프트를 기준으로 변화된 다른 조건을 더해서 비교하는 방법을 사용하였다. 4장에서 제시된 모든 차량의 생성 이미지는 각각 생성된 날짜와 시각을 표시하였다.

먼저 입력된 프롬프트는 「29 % of hood length coupe, sleek front windshield glass, low profile, short front overhang, geometric shape, matt silver body color, white background studio environment, --ar 16:9」이다. Fig. 3은 프롬프트의 실행 결과로 생성된 이미지에서 다양하게 변화된 세부 형태를 가진 쿠페형 차량의 이미지를 확인할 수 있다.

Fig. 3

Generated images of coupe on 2024-07-27, 10:31

Fig. 3에서 제시된 생성 이미지는 정측면 뷰의 조건을 제시하지 않은 상태에서 다양한 데이터를 학습한 결과로 나온 것으로 볼 수 있다. 특히 2번과 4번 이미지는 특정 브랜드를 부착한 차량의 모습으로 생성된 이미지를 제시하고 있다. 이는 기본적으로 인공지능 플랫폼이 기존의 차량 이미지 데이터를 조합한 결과를 보여주기 때문에 나타난 결과로 보인다.

그리고 Fig. 3을 생성하기 위해 사용된 프롬프트를 이미지, 텍스트, 그리고 매개변수 등의 입력 형식에 의해 구분해 정리한 것이 Table 9이다.

Prompt analysis of Fig. 2

한편, Fig. 4에서 제시한 생성 이미지를 위해서 사용된 프롬프트에서 「29% of hood length coupe, sleek front windshield glass, low profile, short front overhang, geometric shape」의 이미지 프롬프트는 Fig. 3과 같은 것이지만, 이후의 「Voronoi: irregular pentagon shaped epidermis」가 변경된 것이며, 「Matt silver body color, white background studio environment」는 다시 같은 것이고, 이어지는 「Translucent: transparent material with sense of ambiguity」를 바꾸었으며, 마지막의 매개변수 「--ar 16:9」는 같다. 즉 같은 명령어 사용조건에서 굵은 글씨체로 구분한 형태와 질감 변화 명령어를 더한 것이다.

Fig. 4

Generated images of coupe on 2024-07-31, 15:29

Table 10에서 이미지와 텍스트 프롬프트의 차이는 셀에 음영이 더해진 「Voronoi: irregular pentagon shaped epidermis」, 「Translucent: transparent material with sense of ambiguity」 등 두 종류의 코퍼스이다. 이렇게 변화된 프롬프트가 더해져 생성된 Fig. 4의 네 종류의 이미지에서 4번의 이미지를 선택해서 같은 프롬프트로 재실행시켜 생성된 네 장의 이미지 모음이 Fig. 5이다.

Prompt analysis of Fig. 4

Fig. 5

Generated images of coupe on 2024-07-31, 15:46

그리고 Fig. 5의 이미지에서 1번 이미지를 바탕으로 업스케일(upscale) 실행으로 생성된 단독 이미지가 Fig. 6이다. 생성된 이미지는 불규칙한 다각형의 표면 특성을 나타내는 보로노이(Voronoi: irregular pentagon shaped epidermis) 특성이 구현된 것으로, 기하학적 평면(Plane)으로 구성된 다면체(Truncated polygon)의 면 구조로 구성된 차체 형태를 보여준다.

Fig. 6

Generated images of coupe on 2024-07-31, 15:50

4.2 질감 특성 조합에 의한 생성

본 절에서는 같은 차체 조형 생성 명령어의 사용조건에서 질감 특성의 변화 명령어를 더해서 생성시킨 이미지를 살펴본다. Fig. 7의 생성 이미지를 위해 사용된 프롬프트에서 「29 % of hood length coupe, sleek front windshield glass, low profile, short front overhang, geometric shape, Translucent: transparent material with a sense of ambiguity」를 같으며, 「Fractal: the pattern of the epidermis arranged by a single pattern」를 더했다. 그리고 「White diffusion: the original material adds white tones. Irregularity: the irregularities in the epidermis are layered patterns, matt silver body color, white background studio environment, --ar 16:9」는 같다.

Fig. 7

Generated images of coupe on 2024-08-01, 10:26

곡면과 양감의 생성을 통한 형태 변화를 살펴보는 실험을 위해 프랙털(Fractal) 형태와 관련한 코퍼스 「Fractal: the pattern of the epidermis arranged by a single pattern」를 추가하여 입력하였다. 이렇게 생성된 이미지 Fig. 7은 차체 조형의 완성도는 볼 수 있으나, 창의적 특성이 크지 않다는 판단으로, 새로운 프롬프트를 작성해 입력해 얻은 것이 Fig. 8이다.

Fig. 8

Generated images of coupe on 2024-08-01, 10:34

Fig. 8을 위해 사용된 프롬프트는 「29 % of hood length coupe, sleek front windshield glass, low profile, short front overhang」을 유지하면서, 새로운 내용의 「Appearance: a pattern of epidermis dispersed outward by a point. Gradient: random fusion of epidermal colors. Fluidity: curved and lined epidermis material. Glossy: the surface pattern has a glossy feel. Curve: add curved curve decorations to the epidermis. Translucent: transparent material with a sense of ambiguity. Fractal: the pattern of the epidermis arranged by a single pattern. White diffusion: the original material adds white tones. Irregularity: the irregularities in the epidermis are layered patterns」를 더했고, 이후 「white background studio environment, --ar 16:9」는 그대로 유지했다.

그러나 전반적으로 차체의 조형 변화의 폭이 크게 나타나지 않은 이미지가 생성됨에 따라 여기에서 「White background studio environment」라는 배경 조건으로 인한 영향이 있을 것이라는 추론으로, 배경 조건을 제거한 프롬프트로 새로이 생성한 이미지가 Fig. 9이다.

Fig. 9

Generated images of coupe on 2024-08-01, 11:31

배경 조건을 제거해 실행시킨 Fig. 9Fig. 8과 비교해 많은 차이를 보여준다. 여기에 사용된 수정된 프롬프트는 「29% of hood length coupe, sleek front windshield glass, low profile, short front overhang, Irregularity: the Irregularities in the epidermis are layered volumes, Fractal: a pattern of epidermis arranged by a single pattern. Translucent: transparent material with a sense of ambiguity. Glossy: the surface pattern has a glossy feel. Gradient: random fusion of epidermal rainbow colors. Fluidity: curved and lined epidermis material. Glossy: the surface pattern has a glossy feel. Curve: add curved curve decorations to the epidermis. Translucent: transparent material with a sense of ambiguity. --ar 16:9」이다.

한편으로, 이렇게 생성된 이미지에서 생성 명령을 한 번 더 실행시켜 얻은 이미지가 Fig. 10이다. 그러나 이 실행에서는 똑같은 프롬프트를 사용했음에도 단순한 스튜디오 조건의 배경으로 이미지가 생성된 결과를 얻을 수 있었다.

Fig. 10

Generated images of coupe on 2024-08-01, 11:39

그리고 여기에서 조형 감성을 변화시키는 요소로써 불규칙성을 더한 조형을 생성한 것이 Fig. 11이며, 적지 않은 차이를 보여준다.

Fig. 11

Generated images of coupe on 2024-08-01, 11:47

다시 입력한 프롬프트에서는 「29 % of hood length coupe, sleek front windshield glass, low profile, short front overhang」는 유지하였고, 「Voronoi: irregular pentagon shaped epidermis」를 바꾸었다. 「Irregularity: the irregu-larities in the epidermis are layered patterns. Fractal: a pattern of epidermis arranged by a single pattern」까지는 그대로 유지하였고, 「Curve: add curved curve decorations to the epidermis」를 더했다. 한편, 「Translucent: transparent material with a sense of ambiguity」는 유지했고, 「Glossy: the surface pattern has a glossy feel」를 변경했다. 매개변수 「--ar 16:9」는 같다.

굵은 글씨로 표시된 추가 프롬프트가 더해진 명령어를 바탕으로 생성된 이미지 Fig. 11은 창의적 차체 조형이라는 관점에서 표피 구조의 변화를 극단적으로 보여주고 있다. 이것은 Fig. 11을 위한 프롬프트를 분석한 Table 11에서 음영으로 처리된 특성 서술어가 묘사하는 불규칙성, 곡선의 장식, 그리고 표면 광택 등의 요인이 작용한 것이라고 할 수 있다.

Prompt analysis of Fig. 11

차량의 차체 조형이 주행 성능을 나타내는 추상성뿐 아니라, 성능을 위한 기능적 디자인이어야 한다는 점에서 보로노이 개념에 의한 불규칙성은 기능성과 상반된 특징을 가지는 요소이다. 그러나 조형의 창의성이나 조형 감성의 신규성이라는 관점에서 디자이너의 초기 발상에 창의적 아이디어를 강화하는 역할로서의 의미를 볼 수 있다.

4.5 인공지능 기반 창의적 조형의 시사점

인공지능 플랫폼을 활용한 이미지 생성 결과물은 그 사실성과 신속성, 그리고 의외성을 동반한 특성으로 인해 디자인 개발 분야에서 활용 가능성을 볼 수 있다는 점이 최근의 인식이다. 그것은 창의적 사고에서 디자이너 인식의 한계, 혹은 논리적 사고에 의한 실현 가능성 추구가 오히려 창의적 조형에서는 걸림돌이 되기 때문이기도 하다.

그러한 한계를 극복하기 위해 발상 단계에서 필요한 창의성을 고무시키는 방법으로 비고츠키(Lev Vygotsky; 1896 ~ 1934)가 제시한 비계(飛階; Scaffold)와 같은 역할을 하는 기법인 브레인스토밍(Brainstorming), 강제결합법(Forced combination), 혹은 스캠퍼(SCAMPER; Substitute, Combine, Adapt, Modify, Magnify, Minify, Put to other uses, Eliminate, Rearrange, Reverse) 기법 등이 활용되는 것도 사실이다.

생성형 인공지능 플랫폼에서는 수많은 데이터 비교를 통한 이미지 생성 알고리즘의 결과로 서로 다른 대상의 결합 작업에서 인식적 사고를 뛰어넘는 실행 속도와 이미지의 사실성을 보여준다. 이러한 점들이 생성형 인공지능을 활용의 장점의 하나이다. 이에 따라 생성형 인공지능 플랫폼을 이용한 작업은 디자이너에게 초기의 창의적 아이디어 발상을 고무시키는 역할을 할 수 있을 것으로 보인다.

그러나 인공지능 플랫폼을 활용한 이미지 생성은 시각적 이미지 제시에 한정돼 있다는 점에서 생성된 이미지를 차량 디자인 개발 데이터로 활용하거나 하는 등에는 한계가 있을 것이다. 물론 「비스컴(Vizcom)」 등과 같이 스케치를 바탕으로 3차원 데이터까지 형성해주는 인공지능 플랫폼의 등장으로 활용성이 높아질 개연성은 있다.

그러나 창의적 차체 조형이 실용성을 가지는 현실 속의 차량으로 양산되기 위해서는 성능이나 안전도, 사용성과 원가 등 많은 제약조건을 통과해야 하는 과정이 필요하다. 그럼에도 인공지능 플랫폼을 활용한 이미지 생성이 창의적 사고나 발상이 필요한 디자이너의 인식적 한계를 넓혀주고, 나아가 새로운 발상의 촉매제 역할을 할 것이라는 점은 하나의 장점이라고 할 것이다. 이에 주요 장점을 정리하면 이와 같다.

  • - 아이디어의 다양성 확보
  • - 사실적 형태와 질감의 제시
  • - 고정관념을 뛰어넘는 아이디어의 조합
  • - 예측이나 통제 범위를 벗어난 이미지 생성
  • - 복잡한 구조나 형태의 사실적 표현

한편 단점으로 구분할 수 있는 요소는 이와 같다.

  • - 시각적 이미지만을 제시
  • - 실현 가능성 검토 불가능
  • - 통제성의 한계 파악의 어려움

이 내용을 표로써 정리하면 Table 12와 같다.

Advantages and disadvantages of AI flat form based design developing

인공지능을 활용한 창의적 조형 생성은 창의적 디자인 아이디어의 출발점으로서 의미는 가지지만, 차량 디자인 개발에 직접 활용되거나 혹은 개발 기간을 단축하는 역할까지 기대할 수 있는 정도에는 이르지 못했음도 볼 수 있었다.


5. 결 론

두 번의 선행연구와 본 논문에서 인공지능 플랫폼을 이용한 이미지 생성 실행과 분석을 통한 창의적 차체 형태 생성의 고찰을 통해서 살펴본 내용을 바탕으로 한다면, 많은 데이터의 비교를 통해 생성된 이미지를 제시하는 생성형 인공지능 플랫폼은 논리적 사고를 뛰어넘는 실행 속도와 이미지의 사실적인 구현이라는 관점에서도 높은 효율성을 볼 수 있다.

이러한 특징은 생성형 인공지능을 활용한 이미지 작업의 장점 중의 하나임을 볼 수 있었다. 또한, 선행연구를 통해 전체적으로 정량적(定量的; Quantitative) 개념보다 정성적(定性的; Qualitative) 개념의 어휘와 조형의 연합으로 생성되는 인공지능 플랫폼의 결과물이 디자이너에게 통제력의 개념을 가지게 하면서 초기의 창의적 조형 작업에서 보조적 수단으로 활용될 수 있다는 시사점도 볼 수 있었다.

실질적으로 사람의 창의적 사고 활동에는 논리적 사고와 이성적 판단이 오히려 제약으로 작용한다는 점에서, 그것이 배제된 인공지능 플랫폼의 생성 이미지를 활용하는 것이 사람의 창의적 사고의 범위를 넓혀줄 수 있다는 점에서 조력자로 활용될 가능성도 크다.

그러나 생성 이미지 제공을 넘어서는 창의적 활동으로서의 디자인의 개발과 완성은 여전히 사람의 역할임에는 변함이 없을 것이다. 앞으로 인공지능 기술의 발전에 따라서 인공지능 플랫폼의 활용 방법이나 분야에서 고도화와 보편화가 진전된다면, 그것을 어떤 방향으로 활용할 것인가에 관한 많은 논의가 필요할 것으로 보인다.

Acknowledgments

이 논문은 2024년도 정부(교육부, 산업부)의 재원으로 한국디자인진흥원의 지원을 받아 수행된 연구임(신기술융합디자인 혁신인재양성사업).

References

  • S. Koo, “An Observation on Composition Elements of Vehicle Body Design Descriptive Words for AI Platform Based Design”, Transactions of KSAE, Vol.32, No.1, pp.37-48, 2024. [https://doi.org/10.7467/KSAE.2024.32.1.37]
  • S. Koo, “An Observation on Methodology for Body Shape Design Developing with AI Platform”, Transactions of KSAE, Vol.32, No.1. [https://doi.org/10.7467/KSAE.2024.32.12.1003]
  • Prompts, Retrieved from https://docs.midjourney.com/docs/prompts, , 2024-07-25.
  • H. Yoon and A. Hirvela, “ESL Student Attitudes toward Corpus Use in L2 Writing,” Journal of Second Language Writing, Vol.13, No.4, pp.257-283, 2004. [https://doi.org/10.1016/j.jslw.2004.06.002]
  • S. Koo, “Changing Aspect of Coupé Type Body Designs”, Transactions of KSAE, Vol.32, No.1, pp.37-48, 2024. [https://doi.org/10.7467/KSAE.2024.32.9.737]

Fig. 1

Fig. 1
Explanation for numbers of generated images and execution buttons on the screen

Fig. 2

Fig. 2
Generated images of coupe by Midjourney flat form, 2024-07-26-13:34

Fig. 3

Fig. 3
Generated images of coupe on 2024-07-27, 10:31

Fig. 4

Fig. 4
Generated images of coupe on 2024-07-31, 15:29

Fig. 5

Fig. 5
Generated images of coupe on 2024-07-31, 15:46

Fig. 6

Fig. 6
Generated images of coupe on 2024-07-31, 15:50

Fig. 7

Fig. 7
Generated images of coupe on 2024-08-01, 10:26

Fig. 8

Fig. 8
Generated images of coupe on 2024-08-01, 10:34

Fig. 9

Fig. 9
Generated images of coupe on 2024-08-01, 11:31

Fig. 10

Fig. 10
Generated images of coupe on 2024-08-01, 11:39

Fig. 11

Fig. 11
Generated images of coupe on 2024-08-01, 11:47

Table 1

Explanations of prompting notes

Contents explanations
Word choice Word choice matters. More specific synonyms work better in many circumstances. Instead of big, try tiny, huge, gigantic, enormous, or immense.
Plural words and collective nouns Plural words leave a lot to chance. Try specific numbers. “Three cats” is more specific than “cats.” Collective nouns also work, “flock of birds” instead of “birds.”
Focus on what you want It is better to describe what you want instead of what you don’t want. If you ask for a party with “no cake,” your image will probably include a cake. To ensure an object is not in the final image, try advanced prompting using the --no parameter.
Prompt length and details Prompts can be simple. A single word or emoji will work. However, short prompts rely on Midjourney’s default style, allowing it to fill in any unspecified details creatively. Include any element that is important to you in your prompt. Fewer details mean more variety but less control.

Table 2

Formats and category of prompts

Prompts Format Category
Image prompt Appearance of object: XX Descriptive words,
qualitative words
Text prompt Material: XX Designative words,
quantitative words
Function: XX
Glossy: glossy, matt, flat, etc.
Surface color: XX
Background: environment
Parameters --ar X:X

Table 3

Examples of parameters used in Midjourney

Parameters Examples Contents Explanations
--ar --ar 3:1 Screen ratio Adjustment
--nijii --niji Animation Creating Japanese animation-style images
--no --no tree Request for exception Request to exclude certain objects and colors
--s --s 100 Artistic effects Midjourney’s own artistry vs. command consistency
→ more artistic effects according to the figures
→ default: 100 (0 ~ 1,000)
--v --v 5.2 Version Select Midjourney version
→ recent the version results higher image quality
→ each version has a specific style
--w --w 300 Uniqueness Give to images a quirky and unique character
→ more quirky and unique character according to the figures
→ default: 0 (0 ~ 3,000)
--c --c 50 Variety Diversity of the first four created images
→ more diversity of the first four created images according to the figures
→ default: 0 (0 ~ 100)

Table 4

Prompt analysis for Fig. 2

Image prompt The appearance of a car: 29 % of length of hood
Fast back body 2 door coupe
Shape of body: aerodynamic body
Text prompt Material: transparent glass
Function: high speed driving
Glossy: the shape surface has a glossy feel
Surface color: Italian red
Parameters --ar 3:1

Table 5

Corpora for image prompts

Korean English
조형성: 유선형의 물체 Formality: a streamlined object
색상: 색상과 금속성 색상의 물체 Color: colored and metal colored object
대칭성: 좌우의 형태가 대칭인 물체 Symmetry: an object whose left and right shapes are symmetrical
형태 연속성: 연속성을 가진 형태 Shape continuity: all surfaces are connected to form whole shape
광택: 광택이 있는 물체 Glossiness: a glossy object
부피: 내부에 부피가 있는 물체 Volumetric: an object with volume inside
재질감: 전체적으로 금속 재질 Material: an object made metals
기능성: 공기역학적 물체 Function: aerodynamic object
촉감: 금속 입방체와 구로서 차가운 촉감이다. Touch: metal blocks and large metal balls and cold touch
형태 유동성: 전체 형태가 유동적이다. Shape fluidity: overall shape has fluidic surface
차별성: 각 부분의 재질이 다른 물체 Difference: objects with different materials with parts
시각적 인상: 날렵하고 신속해 보인다 Visual impression: it looks sleek and fast

Table 6

Generated images from the image prompts

Generated images Prompts
Formality: a streamlined object, --ar 3:1
Color: colored and metal colored object, --ar 3:1
Symmetry: an object whose left and right shapes are symmetrical, --ar 3:1
Continuity: all surfaces are connected to form whole shape, --ar 3:1
Glossiness: a glossy object, --ar 3:1
Volumetric: an object with volume inside, --ar 3:1
Metal: an object made metals, --ar 3:1
Function: aerodynamic object, --ar 3:1
Touch: metal blocks and large metal balls and cold touch, --ar 3:1
Fluidic: overall shape has fluidic surface, --ar 3:1
Differentiation: objects with different materials with parts, --ar 3:1
Visual: it looks sleek and fast, --ar 3:1

Table 7

Corpora for shape characteristics

Korean English
반복: 동일한 형태가 반복적으로 배열 Repeated: repeated arrangement of the same shape
투명성: 빛이 전달되는 재질 Transparency: light can be transmitted
반투명: 희미한 느낌을 주는 투명 재질 Translucent: transparent material with sense of ambhguity
보로노이: 불규칙한 오각형 모양의 표피 교차된 오각형으로 이루어진 문양 Voronoi: irregular pentagon shaped epidermis A pattern formed by intersecting pentagons
유동성: 부드러운 곡으로 배열된 재질 Fluidity: curved lines epidermis material
그라데이션: 색이 무작위로 융합함 Gradient: random fusion of epidermal colors
프랙탈: 단일 규칙으로 배열된 무늬 Fractal: the pattern of the epidermis arranged by a single pattern
곡선: 표면에 곡선이 있다 Curve: add curved decoration to the epidermis
분산: 한 점에서 외부로 분산된 무늬 Dispersion: a pattern of epidermis dispersed outward from a point
흰색 확산: 본래의 재료에 흰색을 더한다 White diffusion: white tones are added to the original material
광택: 표면에 광택이 있다 Glossy: the surface pattern has a shiny feel
불규칙성: 표피에 요철이 무작위로 배열된 무늬 Irregularity: the irregularities in the epidermis are layered patterns
반사: 발산하는 빛이 표피에서 나타난다. Reflection: reflects the pattern of the epidermis of radiating light
수직선: 규칙적인 세로 직선 문양을 추가한다 Vertical line: adds regular vertical straight pattern

Table 8

Corpora for shape characteristics descriptions

Generated images Prompts
Repeated: repeated arrangement of the same shape, --ar 3:1
Transparency: light can be transmitted, --ar 3:1
Translucent: transparent material with sense of ambiguity, --ar 3:1
Voronoi: irregular pentagon shaped epidermis, --ar 3:1
A pattern formed by intersecting pentagons, --ar 3:1
Fluidity: curved lines epidermis material, --ar 3:1
Gradient: random fusion of epidermal colors, --ar 3:1
Fractal: the pattern of the epidermis arranged by a single pattern, --ar 3:1
Curve: add curved decoration to the epidermis, --ar 3:1
Dispersion: a pattern of epidermis dispersed outward from a point, --ar 3:1
White diffusion: white tones are added to the original material, --ar 3:1
Glossy: the surface pattern has a shiny feel, --ar 3:1
Irregularity: the irregularities in the epidermis are layered patterns, --ar 3:1
Reflection: reflects the pattern of the epidermis of radiating light, --ar 3:1
Vertical line: adds regular vertical straight pattern, --ar 3:1

Table 9

Prompt analysis of Fig. 2

Image prompt Appearance of a car: 29 % of hood length coupe side view
Sleek front windshield glass
Low profile
Short front overhang
Geometric shape
Text prompt Matt silver body color
White background studio environment
Parameters --ar 16:9

Table 10

Prompt analysis of Fig. 4

Image prompt Appearance of a car: 29 % of hood length coupe side view
Sleek front windshield glass
Low profile
Short front overhang
Geometric shape
Voronoi: irregular pentagon shaped epidermis
Text prompt Matt silver body color
White background studio environment
Translucent: transparent material with sense of ambiguity
Parameters --ar 16:9

Table 11

Prompt analysis of Fig. 11

Image prompt Appearance of a car: 29% of hood length coupe
Sleek front windshield glass
Low profile
Short front overhang
Voronoi: irregular pentagon shaped epidermis
Irregularity: the Irregularities in the epidermis are layered patterns
Text prompt Fractal: a pattern of epidermis arranged by a single pattern
Curve: add curved curve decorations to the epidermis
Translucent: transparent material with a sense of ambiguity
Glossy: the surface pattern has a glossy feel.
Parameters --ar 16:9

Table 12

Advantages and disadvantages of AI flat form based design developing

Advantage - Diversity of ideas
- Presenting realistic shapes and textures
- Idea combination with transcending stereotypes
- Generating images beyond scope of prediction or control
- Realistic image generating of complex structures and shapes
Disadvantage - Presenting only visual images
- Impossible of feasibility study
- Difficulty in identifying limits to controllability