deep learning(4)
-
Pix2Pix code review 코드리뷰
아무래도 Test보다는 Train이 고려할 것이 많다보니 Train 과정 먼저 살펴보겠습니다. 빨간 글씨: 의문점/공부해야할 부분 1. parser에서 여러 옵션들을 parse해오고, dataset을 만들어 줌 opt = TrainOptions().parse() # get training options dataset = create_dataset(opt) # create a dataset given opt.dataset_mode and other options dataset_size = len(dataset) # get the number of images in the dataset. print('The number of training images = %d' % dataset_size) ㅇ이 과정에서 ..
2021.04.08 -
Batch Normalization
※ batch normalization 논문, 동빈나 유튜브 및 다른 자료를 참조하였습니다. 논문이나, kaggle 등 competition에서 batch normalization을 많이 접하게 된다. batch normalization (BN)은 어떤 효과를 가져올까? lr을 잘못 잡으면 gradient가 explode / vanish하거나 local minimum에 빠지는 경우가 생기던 기존 문제 -> parameter scale때문이라고 정의 -> BN수행시 parameter scale의 영향을 받지 않아 높은 lr설정 가능 -> 빠른 학습 weight 초기화에 대한 민감도가 낮아진다 ( lr 등의 hyper parameter 설정에 대한 부담을 줄일 수 있다.) 모델을 일반화 하는 효과(train..
2021.04.02 -
[Pix2Pix]Image-to-Image Translation with Conditional Adversarial Networks
Berkeley AI Research (BAIR) Laboratory, UC Berkeley 에서 발행한 논문입니다. Abstract image-to-image translation problems에 대한 일반적인 방법부터 Contitional adversarial networks를 사용한 방법까지 조사했다. Image-to-Image translation problems를 다루는 Networks는 입력 이미지에서 출력 이미지로 가는 mapping을 학습할 뿐만 아니라 loss function도 학습 -> image-to-image translaotion problems에서 각 상황에 따라 사용되는 loss functions이 달랐지만 paper에서 제안한 방식을 적용하면 동일한 loss function..
2021.03.30 -
여러가지 Convolution연산
GAN을 깊게 공부하다가 DCGAN에서 Transposed Convolution이라는 것을 마주하게 되었다. 그러한 김에 여러가지 convolition 연산에 대해 정리해보기로 했음 :) 1. Strided Convolution padding없이 kernel이 지정된 stride에 맞게 이동하면서 conv연산을 진행해줌으로써 너비와 높이가 감소합니다. 2. Dilated Convolution Dilated Convolution은 Convolutional layer에 또 다른 파라미터인 dilation rate를 도입했습니다. dilation rate은 커널 사이의 간격을 정의합니다. dilation rate가 2인 3x3 커널은 9개의 파라미터를 사용하면서 5x5 커널과 동일한 시야(view)를 가집니다..
2021.03.19