Skip Navigation
Skip to contents

Journal of Powder Materials : Journal of Powder Materials

OPEN ACCESS
SEARCH
Search

Articles

Page Path
HOME > J Powder Mater > Volume 32(3); 2025 > Article
Research Article
기계학습을 활용한 3차원 적층제조용 알루미늄 합금 개발
안성빈, 한주연, 전서연, 김도원, 설재복, 최현주*
Development of Aluminum Alloys for Additive Manufacturing Using Machine Learning
Sungbin An, Juyeon Han, Seoyeon Jeon, Dowon Kim, Jae Bok Seol, Hyunjoo Choi*
Journal of Powder Materials 2025;32(3):202-211.
DOI: https://doi.org/10.4150/jpm.2025.00150
Published online: June 30, 2025

국민대학교 신소재공학부

School of Materials Science and Engineering, Kookmin University, Seoul, 02707, Republic of Korea

*Corresponding Author: Hyunjoo Choi, TEL: +82-2-910-4287, FAX: +82-2-910-4320, E-mail: hyunjoo@kookmin.ac.kr
• Received: May 13, 2025   • Revised: June 9, 2025   • Accepted: June 10, 2025

© The Korean Powder Metallurgy & Materials Institute

This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/4.0/) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

  • 19 Views
  • 1 Download
prev next
  • The present study introduces a machine learning approach for designing new aluminum alloys tailored for directed energy deposition additive manufacturing, achieving an optimal balance between hardness and conductivity. Utilizing a comprehensive database of powder compositions, process parameters, and material properties, predictive models—including an artificial neural network and a gradient boosting regression model, were developed. Additionally, a variational autoencoder was employed to model input data distributions and generate novel process data for aluminum-based powders. The similarity between the generated data and the experimental data was evaluated using K-nearest neighbor classification and t-distributed stochastic neighbor embedding, with accuracy and the F1-score as metrics. The results demonstrated a close alignment, with nearly 90% accuracy, in numerical metrics and data distribution patterns. This work highlights the potential of machine learning to extend beyond multi-property prediction, enabling the generation of innovative process data for material design.
This study uses machine learning, including ANN, GBR, and VAE, to design aluminum alloys for additive manufacturing, balancing hardness and conductivity. Generated data closely matches experimental results, demonstrating ML’s potential for innovative material design beyond property prediction.
자동차 산업에서 경량화는 에너지 효율 향상과 이산화탄소 배출 저감을 위한 핵심 전략으로, 모터, 배터리, 엔진 하우징 등 주요 부품에 적용할 수 있는 경량 소재 기술 개발이 필수적이다. 이에 따라 기존 가공 방식보다 형상 자유도가 높고 재료 효율성이 우수한 적층 제조(Additive Manufacturing, AM) 기술이 주목받고 있으며, 그 중에서도 금속 소재에 적용 가능한 직접 용착 방식 적층 제조(Directed Energy Deposition, DED)가 효과적인 대안으로 부상하고 있다[1, 2].
DED는 금속 분말을 고출력 레이저로 용융•응고시켜 적층하는 방식으로, 자유로운 형상 제작, 높은 공정 속도, 다양한 소재 조성 적용 가능성 등의 장점을 갖는다[3]. 특히 분말 소결 방식(Powder Bed Fusion, PBF)에 비해 공정 유연성이 높고, 대형 부품의 제작이나 보수에도 적합하여 실용성이 크다[4]. 이러한 장점으로 인해, 알루미늄 합금과 DED 공정의 융합은 경량 부품 제조를 위한 유망한 기술 조합으로 주목받고 있다. 그러나 대표적인 상용 경량금속인 알루미늄 합금은 높은 레이저 반사율, 낮은 용접성, 공정 중 휘발성 원소의 증발로 인한 기공 형성 등으로 인해 DED 공정 적용 시 기술적인 어려움이 존재한다[5]. 동시에, 자동차 및 항공 분야에서 요구되는 고강도와 고방열 특성은 전도도와 기계적 강도 사이의 상반(trade-off) 관계로 인해 합금 설계에 큰 제약을 준다. 따라서 DED 공정에 적합하면서도 상반 특성을 동시에 만족할 수 있는 알루미늄계 신합금 개발이 필수적이다.
기존 적층제조용 합금 설계를 위해 실험적으로 조성과 공정 조건을 조정해가며 시행착오적으로 최적 조건을 도출하는 방식이 주로 사용되었으나, 이는 시간과 비용이 많이 소요되며 확장성이 떨어진다[6]. 이에 따라 최근에는 시뮬레이션과 기계학습 기반 데이터 분석을 활용하여 조성 설계와 공정 최적화를 동시에 수행하는 연구가 활발히 진행되고 있으며, 이러한 접근은 복잡한 물성 간 관계를 정량적으로 분석하고 새로운 소재를 효율적으로 설계하는 데 효과적인 대안으로 자리잡고 있다.
기계학습은 현재 적층 제조 분야에서 주목받고 있으며, 공정 및 소재 물성의 최적화를 위한 활용이 활발하게 이루어지고 있다[7]. Zouhri등은 SVM(Support Vector Machine)과 MLP (Multilayer perceptron) 분류 모델을 이용한 L-PBF공정으로 설계된 재료의 밀도 측정 및 두 모델에 대한 성능 비교를 진행하였고[8], Abdul 등은 GB(Gradient boosting)기법과 PSO(Particle Swarm Optimization)기법을 융합하여 L-PBF의 9가지 공정 변수에 따른 상대 밀도의 예측과 더불어 특성 중요도 분석과 SHAP(shapley Additive exPlanations)기법을 이용하여 모델의 예측 결과를 해석하였다[9]. Gu등은 L-PBF공정에서 상대 밀도와 표면 거칠기에 대한 예측과 특성 중요도 분석 그리고 학습 데이터의 비율에 따른 성능의 변화를 연구하였으며[10], Cao 등은 Ti-6Al-4V의 L-PBF공정 데이터를 K-means 알고리즘을 이용하여 3가지의 클러스터로 분류한 뒤, 가우시안 프로세스, 랜덤 포레스트, 서포트 벡터 회귀 기법을 이용하여 항복 강도, 인장 강도, 연신율의 예측을 실행한 후 각 클러스터와 예측하고자 하는 물성에 맞는 회귀 모델을 선정한 다음, SHAP 기법을 이용하여 각 물성 별 예측 결과에 따른 해석을 진행하였다[11]. DED 분야에서도 Israt 등은 L(Laser)-DED 공정으로 만들어진 SS316L의 항복강도, 인장강도, 연신율을 XGBoost(eXtreme Gradient Boosting)와 랜덤 포레스트 기법을 사용하여 예측한 다음 성능을 비교하였고[12], Choi는 SUS316L를 이용한 DED 공정의 물성을 예측하는 데에 있어서, 하이퍼파라미터 튜닝이 진행된 5개의 기계학습 모델을 사용하여 어떤 모델이 가장 적합한지 다양한 성능 지표를 이용하여 연구하였다[13]. 그리고, Kim은 Random Forest, SVM 모델을 사용하여 티타늄 합금 DED 공정 최적화를 위해 표면 색깔과 재료 속성 간 연관성을 분석하였다[14].
이러한 선행연구에서는 연구자가 보유하고 있는 데이터셋을 기준으로 가장 성능이 좋은 모델과 최적의 하이퍼파라미터를 도출하였으나, 실험에 쓰이는 데이터셋의 종류, 개수 등의 특성에 따라 최적의 성능이 나올 수 있는 조합이 각기 달라지기에 모든 데이터셋에 일괄적으로 적용하기엔 한계가 있다. 이는, Abdul등[9]과 Cao등[11]이 실시한 실험에서 사용한 SHAP 기법과 특성 중요도 분석 기법도 데이터셋의 특성에 따라 결과가 다르게 나올 수 있다는 것을 의미한다. 위에 언급된 연구들 중 두 가지 이상의 물성에 대한 예측을 진행한 사례가 있었다. 하지만, Gu등[10]과 Israt등[12]이 실시한 실험에서는 모델 자체의 예측 성능이 좋지 않았으며, Cao등[10]이 실시한 실험에서는 하나의 재료에 대하여 공정의 특성에 따라 분류한 클러스터마다 적절한 모델을 선정하였다. 이러한 접근 방식은 다양한 재료를 사용하거나 K-means 또는 기타 기법으로 뚜렷한 클러스터를 만들어내기 어려운 데이터에 적용하는 데 어려움이 있다는 한계가 있다. 또한, 데이터셋의 조성 또는 공정 변수 등의 독립변수와 그로부터 도출되는 종속변수인 물성간의 관계를 학습한 모델을 이용하여 물성을 예측하는 연구는 많이 진행되었으나, 특정 조건을 만족하는 두 가지 이상의 물성 값이 있는 조성과 공정 변수의 수치형 데이터셋을 만드는 연구사례는 적은 편이다.
본 연구에서 재료 설계 및 물성 예측을 목적으로 생성 모델과 기존 기계학습 기법을 융합하여 실험 데이터와 유사한 특성을 지닌 새로운 데이터를 생성하고 이를 검증하는 방안을 제시한다. 이를 위해 입력된 데이터의 분포를 학습할 수 있는 생성 모델인 변분 오토인코더(Variational AutoEncoder, VAE)와 복잡한 문제의 입출력 변수 관계 학습이 용이하여 소재 개발 및 물성 예측 연구에서 널리 쓰이는[15] 인공신경망(Artificial Neural Network, ANN), 그리고 그라디언트 부스팅 회귀 델(Gradient Boosting Regression, GBR)을 사용하였다. 또한, 실험 데이터와 생성된 데이터 두 종류의 데이터 사이의 특성 유사도를 측정함으로써, 두 가지 이상의 상반특성을 모두 만족하는 재료의 DED 공정 설계 및 검증을 위한 새로운 접근법을 제시했다.
직접 용착 적층 제조 공정에 쓰이는 구성 원소의 wt.%(Al, Mg, Si, Cu, Zn) 및 공정 조건(스캔 속도, 레이저 출력)을 포함하는 48개의 데이터를 수집했다. 그림 1은 수집한 데이터베이스에서 경도를 예측하는 방법을 나타내고 있다. 데이터 전처리 시 물성에 대한 조성 값 변화의 민감도가 큰 것을 고려하여, 조성 값과 공정 변수에 평균이 0이고 표준편차가 0.03인 작은 노이즈를 추가하거나, 0.97~1.03 범위의 작은 상수를 곱하여 증강하는 스케일링 과정을 거쳐 데이터를 증강하였다. 이후, 데이터 정규화 과정을 거쳐 기계학습에 용이하도록 처리했다. 따라서 본 연구에서는 조성과 같은 민감 인자에 대해 증강 강도를 제한하고 분포 외삽을 방지하는 필터링을 적용함으로써, 물성 예측의 정밀도를 유지하면서도 데이터의 다양성을 확보하였다.
데이터의 최소값, 최대값, 중앙값 및 표준편차는 표1에 정리되어 있다. 측정된 비커스 경도값의 평균은 87.14 HV이며, 표준편차는 15.68 HV이다. 중앙값은 87.12 HV로, 평균값과 거의 일치하는 것으로 나타나 전체 데이터가 특정 값에 편중되지 않고 비교적 균일하게 분포되어 있음을 확인하였다. 데이터 증강 기법을 통해 총 1920개의 데이터를 생성하였으며, 이는 원본 데이터 40개에 비해 약 40배에 해당하는 양이다. 증강 방법으로는 노이즈 추가와 스케일링 기법을 각각 수행하였으며, 이를 결합하여 각각 960개씩 총 1920개의 데이터를 확보하였다. 증강 데이터의 적정 규모를 검증하기 위해, 증강 배수를 30배, 40배, 50배로 조절하며 모델 성능을 평가하였다. 그 결과, 40배 증강 조건에서 모델의 학습 속도, 예측 정확도, 연산 효율성 간의 균형이 가장 우수하게 나타났으며, 테스트 데이터 기준 R² 값도 약 0.85로 향상되었다. 반면, 30배 증강에서는 데이터 수 부족으로 인한 예측 정확도 낮아졌으며, 50배 증강에서는 연산 비용과 처리 시간이 과도하게 증가하는 비효율이 관찰되었다. 이처럼 40배 증강이 모델 학습과 일반화 성능 향상에 가장 적합한 조건임을 확인하였다. 또한, 데이터 증강은 적은 수의 원본 데이터로 인해 발생하는 과적합 문제를 완화하는 데 효과적임을 입증하였다. 원본 데이터의 한계로 인해 훈련, 검증, 시험 세트로의 분할이 어려워지고, 분할별 성능의 신뢰성과 안정성에 큰 변동이 발생하는 문제를 데이터 증강이 일정 수준 해결할 수 있음을 실험적으로 확인하였다.
이후 특정 범위의 비커스 경도 값을 가지는 데이터를 생성할 때, 데이터셋에서 데이터 학습에 적합한 분포인 70~110 HV를 생성 범위로 설정하였다. 초기에 기준을 70 HV으로 설정하고 +10 HV범위까지 무작위로 20개 생성하였다. 그리고, 기준을 100 HV까지 설정하고 같은 과정을 반복하여 70~110 HV의 물성 값을 가지는 80개의 데이터를 생성하였다. ANN이 경도 값을 토대로 조성과 공정 변수를 예측한 데이터를 생성하고, VAE의 잠재 공간에서 ANN이 생성한 데이터와 실험 데이터 사이의 특성 차이가 비정상적으로 큰 데이터를 필터링함으로써, 데이터의 품질을 향상시켰다.
ANN을 설계할 때 학습 데이터에서는 성능이 좋고, 테스트 데이터에서는 성능이 떨어지는 과적합(Overfitting)을 막기 위하여 히든 레이어 개수를 2개로 설정했다. 출력 레이어를 제외한 나머지 레이어에 활성화 함수로 렐루(ReLU)를 적용하여 시그모이드(sigmoid) 함수의 문제인 기울기 소실 현상을 방지했다. 또한, 모델 학습 도중 검증 손실이 5번 이상 증가하면, 이를 과적합의 전조라 간주하여 학습을 조기 종료(Early Stopping)하도록 설정했다.
VAE는 오토인코더와 외형은 동일하나, 새로운 샘플 데이터를 학습 데이터 분포와 유사하게 생성하는 것이 목적인 생성 모델이다. 잠재 공간이 데이터 특징으로 일정한 분포를 나타내는 특수한 분포를 띈다. 또한, 데이터 분포를 학습할 때, 사후확률 분포를 다루기 쉬운 확률분포로 근사하는 변분 추론을 실시하는데, 분포가 잘 학습되면 자동으로 샘플링이 되며, 손실함수 평가 기준이 명확하기 때문에 학습이 안정적인 장점이 있다[16]. 손실함수는 학습한 잠재 공간과 표준정규분포와의 차이를 계산하는 Kullback-Leiber (KL) divergence와 디코더가 입력된 데이터를 잘 복원했는지 평가하는 cross-entropy함수로 구성된다. 손실함수는 등식 1과 같다.
(1)
L=CrossEntropy(x, x^+DKL (q(z|x)||p(z))
등식1에서 x는 인코더의 입력 값이고, x^는 디코더의 출력 값이다. 또한, q(zx)는 입력 데이터가 사상하는 잠재 공간이고, p(z)는 표준정규분포다. 계산된 손실함수를 기반으로 Adam(Adaptive Moment Estimation) 최적화 알고리즘을 이용하여 VAE의 가중치를 업데이트한다[17].
한편, 그림2는 경도가 예측된 데이터베이스에서 전기전도도까지 예측한 최종 데이터베이스를 구축하는 방법을 나타낸다. 전기 전도도의 예측은 GBR을 사용했는데, 이 모델의 성능을 최적화하기 위하여 하이퍼파라미터 튜닝을 실시했다. GBR의 경우 여러 개의 약한 학습기를 순차적으로 학습하고, 잘못 예측한 데이터에 가중치를 부여하며 오류를 개선해 나가면서 학습해 나가는 부스팅(Boosting) 기법을 사용한다. 이 모델의 성능은 학습 초기의 약한 학습기의 개수(n_estimators), 학습을 진행할 때마다 적용되는 학습률(learning_rate), 학습기의 최대 깊이(max_depth)등의 하이퍼파라미터 조합에 따라 달라지며, 하이퍼파라미터 튜닝 대상으로 앞서 언급한 3개를 선정했다. 본 연구에서는 하이퍼파라미터 튜닝 방법으로 리스트에 입력한 하이퍼파라미터의 조합별 성능 확인을 용이하게 하기 위하여 GridSearchCV 기법을 활용하였는데, 학습기의 개수는 100, 200, 300, 400, 학습률은 0.05, 0.1, 0.15, 0.2, 최대 깊이는 2, 3, 4, 5로 정한 다음, 총 64개의 조합 별 학습기 성능 평가를 수행하였다. 이에 5겹 교차 검증(5-Fold cross validation) 방법을 적용하였다. 조합 한 개의 성능을 테스트할 때, 전체 데이터를 다섯 부분으로 나누고, 그중 한 부분을 테스트 폴드로 정의하였다. 나머지 네 부분은 학습 폴드로 사용하였다. 모델은 학습 폴드로 학습시키고, 테스트 폴드로 예측하여 성능을 도출하였다. 이 과정을 총 5번 반복하여 수행하였다.
이러한 과정을 거쳐 성능이 향상된 GBR은 전기 전도도 실험 데이터를 학습한 다음 ANN과 VAE로 생성된 조성 및 공정 조건 데이터를 이용하여 새로운 데이터의 전기 전도도를 예측하는데 사용되었다.
물성 예측에 사용된 ANN과 GBR의 정확도를 나타내는 지표로 결정계수(R2)를 사용하였으며, 식 (2)를 이용하였다. 이때, y^는 모델이 예측한 값, y는 실험값, y는 실험값의 산술 평균이다.
(2)
R2=1-Σ(yi-y^i)2Σ(yi-y)2
또한, 생성된 데이터의 품질을 효율적으로 검증하기 위하여, 본 연구에서는 분류를 목적으로 하는 기계학습 모델인 K-NN(K-nearest neighbor) 모델과 시각화 모델인 t-SNE(t-distributed Stochastic Neighbor Embedding) 기법을 이용했다.
K-NN은 테스트 데이터와 학습 데이터 사이의 유클리드 거리를 기반으로 하는 기본적인 분류 모델로, 학습 데이터 중 가장 가까운 이웃의 클래스를 통하여 테스트의 클래스를 결정하는데, 본 연구에서는 n_neighbors의 값이 6으로 설정되었다. 이는 하나의 특징에 대한 테스트 데이터를 기준으로 주변의 가장 가까운 6개의 데이터를 사용하여 분류된다는 것을 의미한다. K-NN은 데이터를 가장 유사한 속성에 따라 데이터를 분류하는 거리 기반 모델로, 수치 기반 데이터 분류 작업에서 우수한 성능을 보인다[18].
t-SNE는 비선형 차원 축소 기법으로, 데이터 지점 간의 거리를 측정하고, t분포의 값을 선택하여 그 값을 친밀도로 정의한 다음, 친밀도가 유사한 데이터를 하나의 군집으로 할당한다. t-SNE 기법은 고차원 데이터를 저차원 데이터로 변환하는 차원 축소 기법이기에, 군집들을 시각화해서 표현해주는 데 강점을 보인다[19].
K-NN모델에서 생성된 데이터를 학습 데이터로, 실험 데이터를 테스트 데이터로 설정했다. 이는 생성 데이터가 실제 실험값을 얼마나 잘 반영하는지 검증하고, 생성 데이터의 일반화 가능성과 신뢰도를 평가하기 위한 목적으로 수행된 것이다. 실제로, 생성 데이터와 실험 데이터 간의 분포 및 특성이 유사하다는 가정 하에, 두 데이터를 혼합하여 무작위로 분할한 경우에도 결정계수(R²)에 유의미한 차이가 나타나지 않았다. 그러나 생성 데이터만을 이용하여 학습하고, 실험 데이터를 독립적인 테스트 셋으로 활용하는 방법은 데이터 간의 상관성에 따른 과적합을 방지하며, 모델의 실질적인 예측 성능을 보다 보수적으로 검증할 수 있다는 점에서 의미가 있다고 판단하였다. 품질을 검증하기 전에, 두 종류의 데이터에서 KNN에 이용할 범위 내에 있는 데이터를 추출한다. 이때의 범위는 비커스 경도는 70~110 HV, 전기 전도도는 25~47 %IACS로 정하고, 각각 두 물성을 70~90 HV, 90~110 HV, 25~32 %IACS, 32~47 %IACS 범위로 물성 값의 분포를 고려하여 범위를 나눈다음, 레이블링하여 데이터 이산화를 진행하였다. 이후 정규화를 진행하고, 소수 클래스의 샘플을 합성하여 균형잡힌 데이터셋을 만드는 오버샘플링 기법 중 하나인 SMOTE(Synthetic Minority Oversampling Technique)기법을 이용하여 학습 데이터를 보강하였다.
그림3 (a)는 VAE의 학습 손실과 검증 손실의 변화를 나타낸 것이다. 이 그래프에서 손실은 에포크가 진행됨에 따라, 검증 손실이 큰 폭으로 증가하는 과적합의 징조 없이 입력 데이터의 중요한 특징을 포착하고, 데이터를 잘 복원한다는 것을 알 수 있다.
그림 3 (b)는 ANN모델의 학습 데이터와 테스트 데이터의 정확도를 보여주는 그림이다. 학습 데이터에서의 성능은 0.89, 테스트 데이터에서는 0.91이 나왔는데, 대부분의 데이터 점은 빨간 점선의 y = x, 즉 모델이 예측 값과 실제 값이 동일한 범위 근처에 분포해 있었다. 이는 곧, 모델이 실제 값에 근접하게 예측한다는 것을 의미한다. 다만, 예측 값과 실제 값이 크게 차이나는 데이터가 존재하는데, 이는 스케일링과 노이즈 추가로 인한 데이터의 변형 및 증강으로 인하여 하나의 물성 값에 대응하는 데이터의 범위가 넓어져 물성 예측의 난이도가 전에 비하여 상승했기 때문이다. 다만, 학습 데이터보다 테스트 데이터의 결정계수가 높고, 분포 또한 작은 것으로 보아 학습 후의 모델 성능은 크게 나아졌다는 것을 알 수 있다.
그림4 (a)는 GBR의 하이퍼파라미터 조합별 성능을 색으로 표현한 3차원 좌표계로, 성능이 가장 좋은 조합의 좌표에 별도로 하이퍼파라미터 조합이 (n_estimators, learning_rate, max_depth) 형식으로 표시된다.
5겹 교차 결과, 모든 조합에서 0.89 이상의 정확도를 보이고, 가장 높은 성능을 보인 조합은 (100, 0.15, 4)이며, 0.94의 정확도를 보인다. 가장 낮은 값은 모든 하이퍼파라미터 값이 낮은 (100, 0.05, 2)였으나, 3가지의 하이퍼파라미터 중에서 1개 이상의 가장 높은 값을 가지는 좌표 또한 상대적으로 성능이 좋지 않았다. 이는 트리의 개수와 깊이가 너무 크게 설정되었다면, 모델 자체가 너무 복잡해지기에 과적합으로 이어지기 쉽고, 학습률이 너무 높아진다면 오차가 최소점으로 수렴하기 어렵고 오히려 오차가 커지는 방향으로 최적화가 진행될 수 있기 때문이다.
그림 4 (b)는 GBR의 학습 데이터와 테스트 데이터의 정확도를 보여주는 그림이다. 학습 데이터에서의 성능은 1.00, 테스트 데이터에서는 0.94가 나왔는데, 대부분의 데이터 점은 빨간 점선의 y = x, 즉 모델이 예측 값과 실제 값이 같은 범위에 위치해 있었다. 이는 곧, 두 값이 거의 동일하다는 것을 보여준다. 다만, 학습 데이터와 테스트 데이터 둘 다 일부의 데이터가 y=x 위 아래로 분포한 것을 확인할 수 있는데, 이는 스케일링과 노이즈 추가로 인한 데이터의 변형 및 증강으로 인하여 하나의 물성 값에 대응하는 데이터의 범위가 넓어졌기 때문이다.
표 2는 K-NN의 정확도와, 각 물성의 구간별 F1-score를 나타낸 것이다. 두 물성에 관하여 K-NN의 정확도는 0.7 이상, 구간별 F1-score도 한 구간(90~110 HV)을 제외하면 0.75 이상으로 도출되어 실험 데이터 수 대비 유사성이 높은 데이터를 만들었다는 것을 확인할 수 있다. 90~110 HV 구간에서 F1-score가 낮게 나온 이유는, 70~90 HV 구간에 비하여 데이터의 연속성이 떨어져 데이터 학습에 다른 데이터에 비하여 상대적으로 불리했을 거라 추측된다. 본 연구에서 데이터 증강 기법을 적용하지 않은 경우, 기존의 데이터 분할 비율(훈련:검증:테스트 = 0.8:0.1:0.1)에서 테스트 데이터에 대한 R² 값이 평균적으로 0.72 수준에 머무르는 반면, 증강 기법을 적용한 경우 동일한 분할 조건에서 평균 R² 값이 약 0.85로 유의미하게 향상됨을 확인하였다. 이 결과는 제한된 원본 데이터로 인해 발생할 수 있는 모델의 불안정성과 과적합 문제를 데이터 증강을 통해 효과적으로 완화하였음을 시사하며, 증강 기법이 모델 성능 향상에 중요한 역할임을 보여준다.
그림5는 t-SNE 기법을 이용하여 생성된 데이터(●)와 실험 데이터(X)를 2개의 임의의 특성들 기준으로 시각화한 것이다. 그림5 (a)에서는 생성된 데이터와 실험 데이터가 서로 특성이 크게 차이나지 않으며, 유사성이 높은 것을 알 수 있다. 그림5 (b)에서는 그림5 (a)에 비하여 생성된 데이터와 실험 데이터 군집 간의 차이가 상대적으로 도드라지고, 구간별 데이터 간의 특성 분포 또한 뚜렷하게 관찰되지는 않으나, 실험 데이터 군집에서 벗어난 일부의 데이터의 간극을 메우면서 데이터의 다양성을 높인 것을 확인할 수 있다.
표 3~6은 각각 역설계된 조성과 공정 조건을 비커스 경도와 전기 전도도의 범위에 따라 세분화하여 제시한 데이터로, 각각의 조건이 물성에 미치는 영향을 구체적으로 보여준다. 먼저, 표3은 비커스 경도 70~90 HV 범위에서의 데이터로 대부분 Al 함량은 90.5~92% 수준이고 용질 원자 중에서는 Mg이 0.9~2.0%로, 함량의 최대와 최소의 차이가 3%이상을 보이는 다른 원소에 비하여 비교적 적은 범위에 분포하는 편이다. 이 범주의 설계안에서는 대부분의 샘플의 전기전도도가 28.5~41%IACS값을 가지는 것으로 예측되었다.
표 4는 비커스 경도 90~110 HV 범위에서의 데이터로 대부분 Al 함량은 90~92% 수준이고 용질 원자 중에서는 Mg이 0.8~2.0%로, 표3의 경우와 비슷하나, Si, Cu, Zn 이 세가지의 함량 분포의 범위가 상당히 좁아진 것을 관찰할 수 있다. 이 범주의 설계안에서는 레이저에 의해 가해지는 에너지(Laser power/Scan speed)가 클수록 비커스 경도가 대체로 감소하는 거동을 보이는데, 이는 분말에 가해지는 에너지가 너무 강하면 일부가 증발되어 물성 저하의 원인이 되는 Keyhole이 생겨 경도값이 낮아지는 것으로 추정된다. 또한, 대부분의 샘플의 전기전도도는 29.3~41 %IACS값을 가지는 것으로 예측되었는데, 이는 70~90 HV범위의 비커스 경도를 가지는 소재와 비슷한 범위의 전기 전도도를 가지는 것으로, 경도는 향상시키면서 전기 전도도의 하향은 막아 대체로 상반되는 특성을 동시에 만족하는 것을 알 수 있다.
표5는 본래 전기 전도도의 최소값이 25 %IACS로 설정되어 있었으나, 데이터 생성 결과 28.82 %IACS가 최소값이 된 28~32 %IACS 범위에서의 데이터로 대부분 Al 함량은 90~92% 수준이고 용질 원자 중에서는 Mg의 값이 크게 변동되지 않은 것을 알 수 있다. 다른 물성 구간에 비하여 값의 범위가 좁아 전기 전도도에 관한 다른 변수들 간의 뚜렷한 상관관계는 발견되지 않았다. 이 범주의 설계안에서는 대부분의 샘플의 비커스 경도는 70~99 HV값을 가지는 것으로 예측되었다.
표 6 또한, 본래 전기 전도도의 최대값이 47 %IACS로 설정되어 있었으나, 데이터 생성 결과 40.86 %IACS가 최대값이 된 전기 전도도 32~41 %IACS 범위에서의 데이터로 대부분 Al 함량은 91% 수준으로 다른 물성범위에 비하여 Al 함량의 분포 범위가 좁으며, 용질 원자 중에서는 Mg와 더불어 Zn의 조성 값이 크게 바뀌지 않았다는 것을 알 수 있다. 이 범주의 설계안에서는 대부분의 샘플의 비커스 경도는 71~109HV값을 가지는 것 상당히 넓은 범위로 예측되었다. 이는 표5와 같은 이유로 물성의 범위 자체가 넓게 설정된 것도 있으나, 높은 비커스 경도와 전기 전도도를 동시에 가지는 소재가 생성된 것이 가장 큰 이유로 추측된다.
또한, 표5표6에서 실험 데이터의 전기 전도도 범위와 생성된 데이터의 전기 전도도 범위가 다른 이유는, 실험 데이터에서 최소값과 최대값의 물성을 가지는 데이터의 수가 다른 값에 비하여 적어 모델이 학습하기 어렵기에 모든 전기 전도도 값에 관한 균등한 예측이 어려울 것이라 추측된다.
그림 6은 비커스 경도와 전기 전도도를 각각 X축, Y축으로 하여 생성된 데이터와 실험 데이터를 시각화한 산점도다. 생성 데이터의 경도 및 전기전도도 값은, 실제 실험 데이터를 기반으로 학습된 모델을 통해 예측된 결과이며, 이후 수행된 추가 실험에서도 해당 예측값과 유사한 수준의 물성이 재현됨을 확인하였다. 특히, 주요 조성 조건에서의 경도 및 전기전도도는 각각 ±5% 이내의 오차 범위 내에서 실험값과 일치하여, 생성 데이터의 신뢰성과 본 모델의 예측 정확도가 검증됨을 보여준다. 실험 데이터에서 경도와 전기 전도도 두 개의 물성을 전부 가지고 있는 데이터를 선정하였으며, 생성된 데이터의 비커스 경도 범위인 70~110HV의 범위를 기준으로 한정하여 나타내었다. 시각화 결과, 실험 데이터가 다른 구간에 비하여 매우 적은 100HV~110HV범위에 많은 데이터가 생성되었을 뿐만 아니라, 생성된 데이터의 전기 전도도가 주변 범위에서의 실험 데이터와 비교하여 상당히 높게 나타난 것을 확인할 수 있었다. 이는 두개의 상반되는 특성이 동시에 향상된 소재의 데이터를 제공함과 동시에 불균형한 물성 구간 별 데이터 분포를 보완할 수 있다는 것이다.
본 연구에서는 경도와 전도도라는 상반되는 두 물성을 동시에 만족하는 DED 적층제조용 알루미늄 합금을 기계학습을 통해 개발하였다. 이를 위해 VAE를 이용해 데이터 분포를 학습하고 새로운 데이터를 생성하였으며, 인공신경망ANN과 그라디언트 부스팅 회귀GBR 모델을 통해 물성을 예측하였다. 결론적으로, VAE로 생성한 데이터는 실험 데이터와 90% 이상의 유사도를 보여 데이터의 신뢰성을 입증하였으며, ANN과 GBR 모델은 각각 테스트 데이터에서 결정계수 0.91과 0.94를 기록하여 높은 예측 성능을 보였다. 이로써 비커스 경도와 전기 전도도의 트레이드오프 관계를 극복하는 최적의 소재가 설계 가능함을 확인하였다. 본 연구는 적층제조 공정에 필요한 데이터 생성과 물성 예측의 효율성을 크게 향상시킬 수 있는 기초를 제공하며, 향후 다양한 산업 분야에서 데이터 보강과 새로운 소재 개발에 폭넓게 활용될 가능성이 있다.

Funding

This work was also supported by a National Research Foundation of Korea (NRF) grant funded by the Korean government (MSIT) (NRF-2022R1A5A1030054, RS-2025-00562104).

Conflict of Interest

Hyunjoo Choi serves as an editor of the Science editing, but has no role in the decision to publish this article. Except for that, no potential conflict of interest relevant to this article was reported.

Data Availability Statement

The dataset files used during the current study available from the corresponding author on reasonable request.

Author Information and Contribution

First Author: Undergraduate student; Implementation, writing – original draft

Second Author: PhD student; Review & Editing

Third Author: Master's student; Review & Editing

Fourth Author: Undergraduate student; Review & Editing

Corresponding Author: Professor; Conceptualization, writing–original draft, supervision

Acknowledgments

None.

Fig. 1.
Schematic illustration of the data augmentation and artificial neural network/variational autoencoder (ANN-VAE)-based composition/process–hardness prediction algorithm
jpm-2025-00150f1.jpg
Fig. 2.
Framework for conductivity prediction and validation using gradient boosting regression (GBR) modeling with K-nearest neighbor (K-NN) and t-distributed stochastic neighbor embedding (t-SNE)-based quality assessment.
jpm-2025-00150f2.jpg
Fig. 3.
(a) Training and validation loss progression during variational autoencoder (VAE) epochs and (b) comparison between predicted and measured Vickers hardness values
jpm-2025-00150f3.jpg
Fig. 4.
(a) Model performance across different hyperparameter combinations and (b) comparison between predicted and measured electrical conductivity values.
jpm-2025-00150f4.jpg
Fig. 5.
t-Distributed stochastic neighbor embedding (t-SNE)-based dimensionality reduction results for experimental data (×) and generated data (●) based on (a) Vickers hardness and (b) electrical conductivity.
jpm-2025-00150f5.jpg
Fig. 6.
Scatter plot of Vickers' hardness and electrical conductivity for experimental data and generated data.
jpm-2025-00150f6.jpg
jpm-2025-00150f7.jpg
Table 1.
Ranges, median values, and standard deviations of elemental composition, process parameters, and property data
Al (wt. %) Si (wt. %) Mg (wt. %) Cu (wt. %) Zn (wt. %) Scan speed (mm/min) Laser power (W) Vickers hardness (HV) Electrical conductivity (%IACS)
MAX 98.63 11.62 2.92 7.5 5.23 1000 800 118.9 46.2
MIN 88.31 0.08 0.01 0.03 0 500 400 50.1 25.5
Median 94.46 3.6 0.43 0.98 0 1000 550 87.12 33.02
Average 94.3 3.5 0.55 1.65 0.48 929.17 528.13 87.14 34.2
Standard deviation 2.29 2.96 0.68 1.63 1.26 152.7 74.24 15.68 5.34
Table 2.
Accuracy and range-specific F1-scores of the K-nearest neighbor (K-NN) method for each property
70~90 (HV) 90~110 (HV) 25~32(%IACS) 32~47(%IACS)
Accuracy 0.71 0.81
F1-score 0.78 0.59 0.76 0.85
Table 3.
Composition and processing parameter data for materials with hardness values in the range of 70 to 90 HV
70~90 HV Al (wt.%) Si (wt.%) Mg (wt.%) Cu (wt.%) Zn (wt.%) Scan speed (mm/min) Laser power (W) Vickers Hardness (HV) Electrical Conductivity (%IACS)
1 91.3 1 0.9 4.9 1.9 550 700 89.4 31.32
2 90.7 4 2.0 1.9 1.4 850 400 85.5 37.55
3 90.9 0.5 1.5 4.7 2.4 600 500 76.4 37.2
4 91.7 0.4 1.2 2.3 4.4 550 650 70.4 31.58
Table 4.
Composition and processing parameter data for materials with hardness values in the range of 90 to 110 HV
90~110 HV Al (wt.%) Si (wt.%) Mg (wt.%) Cu (wt.%) Zn (wt.%) Scan speed (mm/min) Laser power (W) Vickers Hardness (HV) Electrical Conductivity (%IACS)
1 91.6 1.8 1.4 2.2 3 1000 500 108.6 35.5
2 91.5 2 1.7 2.7 2.1 1000 600 105.5 36.3
3 90.1 2 1.8 3.4 2.7 800 800 95.8 31.07
4 91.2 2.2 2 2.4 2.2 500 700 90.4 36.4
Table 5.
Composition and processing parameter data for materials with electrical conductivity values in the range of 25 to 32 %IACS
25~32 %IACS Al (wt. %) Si (wt. %) Mg (wt. %) Cu (wt. %) Zn (wt. %) Scan speed (mm/min) Laser power (W) Vickers Hardness (HV) Electrical Conductivity (%IACS)
1 91.6 2.9 1.7 1.7 2.1 500 750 87.9 31.82
2 91.9 2.2 1.8 0.3 3.8 950 600 95.8 31.07
3 91.9 0.7 1.9 2.2 3.3 700 800 97.9 30.18
4 90.4 1.5 1.8 1.9 4.4 800 500 87.1 28.82
Table 6.
Composition and processing parameter data for materials with electrical conductivity values in the range of 32 to 42 %IACS
32~42 %IACS Al (wt. %) Si (wt. %) Mg (wt. %) Cu (wt. %) Zn (wt. %) Scan speed (mm/min) Laser power (W) Vickers Hardness (HV) Electrical Conductivity (%IACS)
1 91.6 3.1 1.6 1.5 2.2 650 400 74.2 40.86
2 91.2 4.2 1 1.9 1.7 1000 500 106.1 38.08
3 91.4 2.1 1.9 2.6 2 900 700 104.9 36.43
4 91.7 4 1.7 0.5 2.1 600 550 93.5 32.69
  • 1. J. Kim, S. Jeon, H. Park, T. Kim and H. Choi: J. Powder Mater., 31 (2024) 302.ArticlePDF
  • 2. U. Ko, W.-C. Lee, G.-S. Shin, J.-H. Yoon and J.-H. Kim: J. Powder Mater., 31 (2024) 220.ArticlePDF
  • 3. S.-N. Singh and A.-B. Deoghare: Met. Mater. Int., 29 (2023) 1563.ArticlePDF
  • 4. S. Mudda, A.-R. Annamalai and A. Muthuchamy: Met. Mater. Int., 31 (2025) 1859.Article
  • 5. Y.-J. An, J.-Y. Han, H. Choi and S.-E. Shin: J. Korean Powder Metall. Inst., 30 (2023) 262.Article
  • 6. S. Jeon, S. Park, Y. Song, J. Park, H. Park, B. Lee and H. Choi: J. Powder Mater., 30 (2023) 463.Article
  • 7. V. Monfared, M. Jahangiri, M. Shabani and M. Maleki: Met. Mater. Int., 29 (2023) 3442.ArticlePDF
  • 8. W. Zouhri, D. Reza, J.-H. Song and H.-M. Kim: CIRP J. Manuf. Sci. Technol., 31 (2020) 607.Article
  • 9. A. Khalad, T.-Y. Kim, B.-H. Lee and J.-W. Park: Int. J. Adv. Manuf. Technol., 135 (2024) 4147.ArticlePDF
  • 10. Z. Gu, J. Wu, T.-X. Li and L. Zhang: J. Intell. Manuf., 34 (2023) 3341.ArticlePDF
  • 11. Y. Cao, Q. Chen, J. Li and S. Zhou: Addit. Manuf., 91 (2024) 104341.Article
  • 12. I.-Z. Era, M. Grandhi and Z. Liu: Int. J. Adv. Manuf. Technol., 121 (2022) 2445.ArticlePDF
  • 13. T.-Y. Choi, M.S. Thesis. Korea University, Seoul (2020) 85.
  • 14. J.-S. Lim, W.-J. Oh, C.-M. Lee and D.-H. Kim: Sci. Rep., 11 (2021) 24169.Article
  • 15. T.-W. Hong, S.-Y. Lee, J.-Y. Choi and H.-K. Kim: Met. Mater. Int., 27 (2021) 3935.ArticlePDF
  • 16. J.-E. Jeong, H.-J. Kim and J.-H. Chun: J. Korea Inst. Inf. Commun. Eng., 22 (2022) 155.
  • 17. S. Park, Y. Kim, J. Han and D. Lee: KIPS Trans. Softw. Data Eng., 11 (2023) 11.
  • 18. J.-G. Kim, C. Jang and S.-S. Kang: Nucl. Eng. Technol., 54 (2022) 1167.Article
  • 19. Y.-J. Lee, S.-M. Choi, H.-R. Lim and M.-K. Park: Palpu Chongi Gisul, 55 (2023) 96.

Figure & Data

References

    Citations

    Citations to this article as recorded by  

      • ePub LinkePub Link
      • Cite this Article
        Cite this Article
        export Copy Download
        Close
        Download Citation
        Download a citation file in RIS format that can be imported by all major citation management software, including EndNote, ProCite, RefWorks, and Reference Manager.

        Format:
        • RIS — For EndNote, ProCite, RefWorks, and most other reference management software
        • BibTeX — For JabRef, BibDesk, and other BibTeX-specific software
        Include:
        • Citation for the content below
        Development of Aluminum Alloys for Additive Manufacturing Using Machine Learning
        J Powder Mater. 2025;32(3):202-211.   Published online June 30, 2025
        Close
      • XML DownloadXML Download
      Figure
      • 0
      • 1
      • 2
      • 3
      • 4
      • 5
      • 6
      Related articles
      Development of Aluminum Alloys for Additive Manufacturing Using Machine Learning
      Image Image Image Image Image Image Image
      Fig. 1. Schematic illustration of the data augmentation and artificial neural network/variational autoencoder (ANN-VAE)-based composition/process–hardness prediction algorithm
      Fig. 2. Framework for conductivity prediction and validation using gradient boosting regression (GBR) modeling with K-nearest neighbor (K-NN) and t-distributed stochastic neighbor embedding (t-SNE)-based quality assessment.
      Fig. 3. (a) Training and validation loss progression during variational autoencoder (VAE) epochs and (b) comparison between predicted and measured Vickers hardness values
      Fig. 4. (a) Model performance across different hyperparameter combinations and (b) comparison between predicted and measured electrical conductivity values.
      Fig. 5. t-Distributed stochastic neighbor embedding (t-SNE)-based dimensionality reduction results for experimental data (×) and generated data (●) based on (a) Vickers hardness and (b) electrical conductivity.
      Fig. 6. Scatter plot of Vickers' hardness and electrical conductivity for experimental data and generated data.
      Graphical abstract
      Development of Aluminum Alloys for Additive Manufacturing Using Machine Learning
      Al (wt. %) Si (wt. %) Mg (wt. %) Cu (wt. %) Zn (wt. %) Scan speed (mm/min) Laser power (W) Vickers hardness (HV) Electrical conductivity (%IACS)
      MAX 98.63 11.62 2.92 7.5 5.23 1000 800 118.9 46.2
      MIN 88.31 0.08 0.01 0.03 0 500 400 50.1 25.5
      Median 94.46 3.6 0.43 0.98 0 1000 550 87.12 33.02
      Average 94.3 3.5 0.55 1.65 0.48 929.17 528.13 87.14 34.2
      Standard deviation 2.29 2.96 0.68 1.63 1.26 152.7 74.24 15.68 5.34
      70~90 (HV) 90~110 (HV) 25~32(%IACS) 32~47(%IACS)
      Accuracy 0.71 0.81
      F1-score 0.78 0.59 0.76 0.85
      70~90 HV Al (wt.%) Si (wt.%) Mg (wt.%) Cu (wt.%) Zn (wt.%) Scan speed (mm/min) Laser power (W) Vickers Hardness (HV) Electrical Conductivity (%IACS)
      1 91.3 1 0.9 4.9 1.9 550 700 89.4 31.32
      2 90.7 4 2.0 1.9 1.4 850 400 85.5 37.55
      3 90.9 0.5 1.5 4.7 2.4 600 500 76.4 37.2
      4 91.7 0.4 1.2 2.3 4.4 550 650 70.4 31.58
      90~110 HV Al (wt.%) Si (wt.%) Mg (wt.%) Cu (wt.%) Zn (wt.%) Scan speed (mm/min) Laser power (W) Vickers Hardness (HV) Electrical Conductivity (%IACS)
      1 91.6 1.8 1.4 2.2 3 1000 500 108.6 35.5
      2 91.5 2 1.7 2.7 2.1 1000 600 105.5 36.3
      3 90.1 2 1.8 3.4 2.7 800 800 95.8 31.07
      4 91.2 2.2 2 2.4 2.2 500 700 90.4 36.4
      25~32 %IACS Al (wt. %) Si (wt. %) Mg (wt. %) Cu (wt. %) Zn (wt. %) Scan speed (mm/min) Laser power (W) Vickers Hardness (HV) Electrical Conductivity (%IACS)
      1 91.6 2.9 1.7 1.7 2.1 500 750 87.9 31.82
      2 91.9 2.2 1.8 0.3 3.8 950 600 95.8 31.07
      3 91.9 0.7 1.9 2.2 3.3 700 800 97.9 30.18
      4 90.4 1.5 1.8 1.9 4.4 800 500 87.1 28.82
      32~42 %IACS Al (wt. %) Si (wt. %) Mg (wt. %) Cu (wt. %) Zn (wt. %) Scan speed (mm/min) Laser power (W) Vickers Hardness (HV) Electrical Conductivity (%IACS)
      1 91.6 3.1 1.6 1.5 2.2 650 400 74.2 40.86
      2 91.2 4.2 1 1.9 1.7 1000 500 106.1 38.08
      3 91.4 2.1 1.9 2.6 2 900 700 104.9 36.43
      4 91.7 4 1.7 0.5 2.1 600 550 93.5 32.69
      Table 1. Ranges, median values, and standard deviations of elemental composition, process parameters, and property data

      Table 2. Accuracy and range-specific F1-scores of the K-nearest neighbor (K-NN) method for each property

      Table 3. Composition and processing parameter data for materials with hardness values in the range of 70 to 90 HV

      Table 4. Composition and processing parameter data for materials with hardness values in the range of 90 to 110 HV

      Table 5. Composition and processing parameter data for materials with electrical conductivity values in the range of 25 to 32 %IACS

      Table 6. Composition and processing parameter data for materials with electrical conductivity values in the range of 32 to 42 %IACS


      Journal of Powder Materials : Journal of Powder Materials
      TOP