본문 바로가기

자연어 처리 과정

AlexNet

개요

CNN 모델 중 하나인 AlexNet에 대해 알아보자.

 

 

AlexNet이란?

Yann Lecun이 Lenet 모델을 통해 1998년 처음으로 도입했던 개념인 Convolution layer를 가지고 만든 모델이다.

그 모델의 이름이 바로 AlexNet이다.

 

이 AlexNet 모델은 Alex Krizhevsk와 Geoffrey Hinton등의 인물들이 제안했고, 이는 ImageNet classification 대회에서 2011년에 발표된 모델에 비해 엄청난 성능의 향상을 보여주었다.

 

Structure of AlexNet

AlexNet은 LeNet과 크게 다르지 않은 형태로 구축된 모델이다.

하지만 분명 다른 점이 존재한다.

 

1. 병렬 구조로 쌓았다는 점

2. 더 깊게 Network를 형성했다는 점

3. 그리고 Convolution layer당 많은 필터를 사용했다는 점

등등

 

이러한 차이점들이 있다.

 

Convolution layer 이외에도 Maxpooling, ReLU가 사용되었으며

학습에 있어서는 dropout, data augmentation, SGD+Momentum이 사용되었다.

 

AlexNet의 이미지 처리 과정

우선 AlexNet의 구조는 아래와 같다.

 

Structure

Input: 227x227x3(RGB)

Conv-1: nums= 96, kernel size= 11, stride= 4, padding= 0

MaxPool-1: size= 3, stride= 2

Conv-2: nums= 256, kernel size= 5, stride= 1, padding= 2

MaxPool-2: size= 3, stride= 2

Conv-3: nums= 384, kernel size= 3, stride= 1, padding= 1

Conv-4: nums= 384, kernel size= 3, stride= 1, padding= 1

Conv-5: nums= 256, kernel size= 3, stride= 1, padding= 1

MaxPool-3: size= 3, stride= 2

FC-1: 4096 fully connected layers

FC-2: 4096 fully connected layers

FC-3: 1000 fully connected layers

 

 

Input 이미지가 227x227x3이라고 할 때 output과 파라미터의 개수 그리고 연산 횟수는 아래와 같다.

 

 

Layer Tensor output size Params(w/ biases) Ops
Input 227x227x3 0 0
Conv-1 55x55x96 96*(11*11*3+1) 227*227*96*11*11*3
MaxPool-1 27x27x96 0 0
Conv-2 27x27x256 256*(5*5*96+1) 27*27*256*5*5*96
MaxPool-2 13x13x256 0 0
Conv-3 13x13x384 384*(3*3*256+1) 13*13*384*3*3*256
Conv-4 13x13x384 384*(3*3*384+1) 13*13*384*3*3*384
Conv-5 13x13x256 256*(3*3*384+1) 13*13*384*3*3*256
MaxPool-3 6x6x256 0 0
FC-1 1x1x4096 4096*(9216+1) 4096*9216
FC-2 1x1x4096 4096*(4096+1) 4096*4096
FC-3 1x1x1000 1000*(4096+1) 4096*1000
Output 1x1x1000 0 0
Total
62,378,344 2,826,123,488

 

'자연어 처리 과정' 카테고리의 다른 글

VGG  (0) 2022.12.18
CNN의 연산  (0) 2022.12.18
Batch normalization  (0) 2022.12.13
Overfitting과 underfitting 그리고 regularization  (0) 2022.12.01
Softmax function and cross-entropy loss  (0) 2022.11.30