AWS Snow Family
- 보안성이 뛰어난 휴대용 장치의 모음
- 두 가지 경우 사용
- 엣지에서 데이터를 수집하고 처리하기 위해 사용
- Snowcone, Snowball Edge
- AWS 안팎으로 데이터를 마이그레이션 할 때
- Snowcone, Snowball Edge, Snowmobile
- 엣지에서 데이터를 수집하고 처리하기 위해 사용
Snow 사용 사례 - 데이터 마이그레이션
- 네트워크를 통해서 많은 데이터를 전송하려면 오랜 시간이 걸림
- 100TB 데이터를 1Gbps로 전송하는 경우 12일이나 걸린다
- 빠르게 AWS에 접속해야할 때가 있는데 이런 경우 전송 가능한 데이터의 양이 적다는 것과 제한된 연결 제한된 대역폭 등 네트워크를 통한 데이터 전송 비용이 발생
- 대역폭 공유, 연결 불안정성 등 문제가 발생할 수 있음
이런 이유들 때문에 Snow Family가 사용됨
Snow Family
- 오프라인에서 데이터 마이그레이션을 실행하는 장치
- AWS가 우편으로 물리적 장치를 보내주면 거기서 데이터를 끌어오고 다시 AWS로 전송
- 데이터를 네트워크 전송시 일주일이 걸린다면 사용해야함
다이어그램
- 직접 S3로 전송하는 경우
- Snow Family를 사용하는 경우
물리적인 경로를 이용하는 방법이다
Snowball Edge(for data transfers)
- TB 혹은 PB 크기의 데이터를 AWS 안팎으로 전송이 가능하다
- 네트워크를 대신해 옮길 수 있다
- 데이터 전송건마다 비용 청구
- 블록스토리지를 제공하거나 S3 호환 객체 스토리지를 제공
- Snowball Edge Storage Optimized
- 블록 볼륨으로 사용할 수 있도록 80TB 하드웨어 디스크 용량 혹은 S3 호환 스토리지 제공
- Snowball Edge Compute Optimized
- 42TB의 HDD 블록 볼륨
- snowball edge를 데이터 전송에 쓰는 경우는 데이터 센터 폐쇄를 위한 대량의 데이터 클라우드 마이그레이션 AWS 데이터 백업 및 복구
AWS Snowcone
- edge보다 훨씬 작다
- 어디서나 컴퓨팅 가능하며 안전하고 가혹한 환경을 견딜 수 있다
- 엣지 컴퓨팅, 스토리지, 데이터 전송에 사용되는데 용량이 작아야 가능
- 8TB 저장가능
- snowball 사용이 불가능할 때 snow con
- 환경적 제약이 있는 경우
- 배터리와 케이블 직접 준비
- AWS 오프라인으로 다시 전송될 수 있고 네트워크에 연결해서 DataSync 사용해서 데이터 재전송
AWS Snowmobile
실제 트럭이다..
- 트럭이 데이터를 전송
- 1 EB = 1,000 PB = 1,000,000TB
- 각 Snowmobile 용량은 100 PB이다
- 보안성, 온도 조절 GPS까지 상당히 안정적임
- 10PB보다 크면 Snowball보다 좋다
Snow Family 사용하는 방법
- 배송을 위해 콘솔에서 장치 요청
- Snowball 클라이언트나 OpsHub를 서버에 설치
- Snowball을 서버에 연결
- 클라이언트를 사용해서 파일을 복사
- 장치를 다시 돌려준다(적합한 AWS 시설로 옮겨진다 → E 잉크 마커)
- S3 버킷에 해당 데이터를 불러들이고나면 가종 높은 보안조치에 따라 Snowball은 완전히 삭제
Snow 사용 사례 - 엣지 컴퓨팅
데이터가 엣지 로케이션에서 생성될 때 실시간으로 처리하는 방식
- 인터넷이 없는 곳이나 클라우드에서 밀리 있는 곳을 엣지 로케이션
- 도로에 있는 트럭, 바다위의 배 등등
- 데이터는 생성되지만 인터넷과 연결되어 있는 곳
- 연결이 제한되거나 인터넷 엑세스가 없거나 컴퓨팅파워에 접근 불가
- 이런 장소에서 컴퓨팅이나 데이터 처리가 필요한 경우를 엣지 컴퓨팅
- Snowball Edge나 snowcone을 주문해서 엣지 로케이션에 장착시키면 됨
- 사용 케이스
- 데이터 전처리
- 엣지에서 머신러닝 처리
- 사전 미디어스트림 트랜스코딩
- 데이터를 AWS로 재전송하는 경우 장치를 보내면 된다
데이터가 생성되는 곳의 아주 가까이에서 데이터를 처리하고 AWS로 보냄
엣지 컴퓨팅
- 스노우콘
- 2 CPUS, 4GB메모리, 유무선 엑세스 Wi-Fi
- USB-C 혹은 선택적 배터리로 작동
- 스노우볼 엣지
- 52 vCPU, 200GB RAM
- 선택적 GPU (영상 혹은 머신러닝)
- 42TB
- 스노우볼 엣지 - 저장공간 최적화
- 40 vCPU, 80GB RAM
- 객체 스토리지 클러스터링
- 모든 장치들은 내부 EC2 인스턴스나 람다함수를 실행 가능
- AWS IoT GreenGrass
- 장기 배포 옵션도 있어 1~3년 빌리면 가격 할인을 받을 수 있다
OpsHub
- 원래 이런 장치를 사용할 떄 CLI를 통해 처리했고 방식도 어려웠음
- 소프트웨어로써 클라우드없이 컴퓨터에 다운로드하여 사용
- GUI를 통해 스노우 장치와 연결해 구성 및 사용 가능
- 단일 장치와 클러스터 장치를 잠금 해제하고 구성 가능
- 파일 전송이 가능해지고 스노우 장치에서 EC2 인스턴스 시작 및 관리
- 장치 메트릭 모니터링과 AWS 호환 서비스 가능
- Ec2 인스턴스, 네트워크 파일 시스템
Solution Architecture: Snowball into Glacier
- 스노우볼은 Glacier에 데이터를 직접 끌어올 순 없다
- 데이터를 가져온 후 S3 수명 주기 정책을 통해 Glacier 객체로 전환 가능
Amazon FSx
- 타사의 고성능 파일 시스템을 실행 시킨다
- RDS에서 AWS에 MySQL이나 Postgres를 실행하는 것과 유사
- 아래 4가지는 알아야함
Amazon FSx for Windows (File Server)
- 완전 관리형 windows 파일 서버 공유 드라이브
- SMB 프로토콜과 Windows NTFS를 지원
- Microsoft Active Directory 통합을 지원하므로 사용자 보안 추가, ACL로 사용자 할당량 추가해 엑세스 제어 가능
- 특징
- Linux EC2 인스턴스에도 마운트할 수 있다
- 온프레미스로 실행중인 파일 서버와 윈도우의 분산파일시스템인 DFS 기능을 이용해 파일 시스템을 그룹화 가능
- 초당 수십 GB, 수백만 IOPS, 수백 PB의 데이터까지 확장 가능
- 스토리지 옵션
- SSD 지연시간이 짧아야하는 워크로드를 저장 (DB 미디어 처리 데이터 분석)
- HDD 넓은 스펙트럼의 워크로드
- 프라이빗 연결로 온프레미스 인프라에서 엑세스 가능
- 고가용성 다중 AZ에 대해 구성 가능
- 재해복구목적으로 S3에 매일 백업된다
Amazon FSx for Lustre
- 분산 파일 시스템 Lustre로 대형 연산에서 사용
- Linux + cluster → 머신러닝 같이 고성능 연산에 사용됨
- 동영상 처리, 금융 모델링 전자 설계 자동화 → 확장성이 상당히 높다
- 초당 수백 GB의 데이터, 수백만 IOPS, 지연시간이 밀리초단위
- 스토리지 옵션
- SSD or HDD
- FSx로 S3를 파일 시스템처럼 읽어들일 수 있다
- VPN과 직접 연결을 통해 온프레미스 서버에서 사용 가능
FSx Lustre - File System Deployment Options
- 스크래치 파일 시스템
- 임시 스토리지로 데이터가 복제되지 않는다
- 서버가 오작동하면 파일이 모두 유실
- 최적화로 초과 버스트를 사용 가능(6배 빨라질 수 있다)
- 단기 처리 데이터에 쓰이며 데이터 복제가 없어 비용 최적화 가능
- Persistent File System
- 장기 스토리지로 동일한 가용영역에 데이터가 복제
- 동일한 AZ내에서만 복제되어 장애에 대응
- 민감한 데이터의 장기 처리 및 스토리지
Amazon FSx for NetApp ONTAP
- AWS의 관리형 NetApp ONTAP 파일 시스템
- NFS, SMB, iSCSI 프로토콜과 호환 가능
- 온프레미스 시스템의 ONTAP이나 NAS에서 실행 중인 워크로드를 AWS로 옮길 수 있다
- 여러 운영체제에서 사용 가능 → 호환 가능한 폭이 넓다
- 스토리지는 오토 스케일링되며 복제와 스냅샷 기능도 지원함
- 압축, 중복 제거도 가능
- 지정 시간 복제 기능이 있어 새 워크로드를 테스트할 떄 상당히 유용
- 신속한 복제 스테이징 파일 시스템
Amazon FSx for OpenZFS
- AWS 관리형 OpenZFS 파일 시스템
- 여러 버전에 NFS 프로토콜과 호환
- ZFS에서 실행되는 워크로드를 내부적으로 AWS로 옮길 때 사용
올바른 파일 시스템을 고르는 문제가 나온다
즉 4가지 서비스간의 차이를 아는게 중요
하이브리드 클라우드를 위한 스토리지
- 일부 인프라는 AWS 클라우드에 있고 나머지는 온프레미스에 두는 방식을 하이브리드
- 마이그레이션이 오래 걸리거나 보안 또는 준수 요건이 있는 경우
- IT 전략
- 아마존 S3는 독점 스토리지 기술로 EFS와는 다름
- S3 데이터를 온프레미스에 두려면 Storage Gateway가 역할을 한다
AWS Storage Cloud Native Options
AWS Storage Gateway
- 온프레미스 데이터와 클라우드 데이터간의 다리 역할
- 유즈케이스
- 재해 복구
- 백업과 복구
- 파일 엑세스 지연시간을 줄이기 위해 온프레미스 캐시로 사용
- S3 File Gateway
- FSx File Gateway
- Volume Gateway
- Tape Gateway
S3 File Gateway
- 온프레미상의 애플리케이션 서버와 연결
- 애플리케이션 서버 입장에서는 NFS or SMB를 사용한 일반적인 파일 공유 엑세스처럼 보인다
- 실제로는 S3 파일 게이트웨이를 사용한
- 이후 버킷 수명주기 정책을 통해 Glacier로 옮길 수 있다
- S3 파일 게이트웨이로 구성한 모든 버킷은 NFS 및 SMB 프로토콜을 이용해 엑세스 가능
- 사용된 데이터는 신속한 엑세스를 위해 파일 게이트웨이에 캐시로 저장
- 버킷에 엑세스하려면 파일 게이트웨이마다 IAM 역할을 생성해야함
- SMB 프로토콜을 사용하는 경우 Active Directory와 통합 필요
- S3 파일 게이트웨이에 사용자가 엑세스할 때 인증을 거치며 S3 버킷에 엑세스할 때도 인증
Amazon FSx File Gateway
- mazon FSx for Windows 파일 서버에 대한 네이티브 액세스 제공
- 게이트웨이 없이도 접근 가능
- 게이트웨이를 생성하면 로컬 캐시 확보 가능 (지연시간 단축)
- Windows 네이티브인 SMB, NTFS, Active Directory와 호환 가능(파일 게이트웨이)
- 그룹 파일 공유나 온프레미스를 연결할 홈 디렉터리로 사용 가능
Volume Gateway
- 블록 스토리지로 S3가 백업하는 iSCSI 프로토콜을 사용
- 볼륨이 EBS 스냅샷으로 저장되어 필요에 따라 온프레미스 볼륨 복구 가능
- 캐시 볼륨 → 최신 데이터데 대한 낮은 지연시간
- 저장 볼륨(Stored volumes) → 전체 데이터 세트가 온프레미스에 있으며 주기적으로 S3 백업
- 온프레미스 서버에 볼륨을 백업하는 것에 의미가 있다
Tape Gateway
- 물리적으로 테이프를 사용하는 회사에 백업을 테이프 대신 클라우드를 활용할 수 있게 함
- 가상 테이프 라이브러리(VTL)는 S3와 Glacier를 이용
- 테이프 기반 프로세스의 기존 백업 데이터를 iSCSI 인터페이스를 사용하여 백업
중요한점
게이트웨이는 온프레미스 데이터 센터, 즉 클라이언트쪽에 설치되어 있어야 한다
클라이언트 회사 데이터 센터 내에서 운영해야한다
Storage Gateway – Hardware appliance
게이트웨이를 실행할 가상 서버가 없는 경우 AWS의 하드웨어를 사용할 수 있다
- 온프레미스 서버가 없는 경우 amazon.com에서 주문 가능
- 미니 서버가 될 하드웨어 어플라이언스를 인프라에 설치한 후 게이트웨이를 구성하면 된다
- 물리적인 설치가 필요하며 컴퓨터 자원이 필요함
- 소규모 데이터 센터의 일일 NFS 백업처럼 가상화가 없는 경우 유용
AWS Storage Gateway 정리
프로토콜과 옵션을 잘 이해하면 됨
AWS Transfer Family
- 전송 제품군으로 S3 또는 EFS 안팎으로 FTP만을 사용해 데이터 전송을 위한 완전 관리형 서비스
- AWS Transfer for FTP (File Transfer Protocol (FTP)) - 파일 전송 프로토콜
- AWS Transfer for FTPS (File Transfer Protocol over SSL (FTPS)) - 암호화된 파일 전송 프로토콜
- AWS Transfer for SFTP (Secure File Transfer Protocol (SFTP)) - 보안 파일 전송 프로토콜
- 둘다 전송 중 암호화
- FTP를 사용해 S3 또는 EFS에 업로드 가능
- 가용성 안정성 확장성이 높다
- 시간당 요금 + 데이터의 GB 요금
- 사용자 자격 증명을 저장 관리 가능 , 외부 인증 시스템과 통합 가능(LDAP)
- S3나 EFS의 FTP 인터페이스를 갖추기 위함
AWS DataSync
- 데이터를 동기화하여 대용량의 데이터를 한곳에서 다른 곳으로 이동
- 온프레미스 / AWS의 다른 클라우드로 데이터 옮길 수 있다
- 서버를 NFS, SMBㄷ등 프로토콜로 연결 + 옮길 위치인 온프레미스나 연결할 다른 클라우드에 에이전트가 있어야한다
- 한 AWS에서 다른 AWS 서비스로 이동할 때는 에이전트가 필요 없다
- 모든 S3의 Glacier를 포함하여 모든 스토리지 클래스에 동기화 가능
- EFS로 네트워크 파일 시스템에 저장 가능
- Amazon FSx
- 복제 작업은 계속 이루어지지 않고 일정 시간마다 스케줄
- 일정에 맞춰 데이터 동기화된다
- 파일권한과 메타 데이터 저장 기능이 있으며 보안과 연관됨
- NFS POSIX, SMB 권한을 준수
- 파일을 다른 곳으로 옮길 때 파일의 메타 데이터 보존 가능
- DataSync 에이전트는 하나의 태스크가 초당 10Gb까지 사용 가능하며 대역폭에 제한 가능
AWS DataSync NFS/SMB를 사용하는 경우
온프레미스 파일을 AWS로 동기화
AWS DataSync는 어디로든 갈 수 있다 → 네트워크 장치가 부족한 경우 snowcone이 사용됨
서로다른 AWS 서비스간 동기화
Storage Comparison
- S3 - 객체 스토리지로 대부분 AWS 서비스와 연결 가능
- S3 Glacier: 객체를 아카이브 할 경우 사용
- EBS 볼륨: 한개의 인스턴스에 한 개의 스토리지 연결 IO1 IO2에 다중 연결 지원
- 인스턴스 스토리지: IOPS가 높다 고성능 물리 스토리지
- EFS: 네트워크 파일 시스템으로 다중 AZ간 마운트하면서 POSIX 파일 시스템 사용
- FSx for Windows: 윈도우 서버 파일 시스템이 필요한 경우
- FSx for Lustre: 고성능 연산 Linux 파일시스템 Lustre와 호환
- FSx for NetApp ONTAP: 높은 운영체제 호환성과 네트워크 파일 시스템
- FSx for OpenZFS: 관리형 ZFS 파일 시스템이 필요한 경우
- Storage Gateway: 온프레미스와 AWS 스토리지 간 연결 S3 및 FSx 파일 게이트웨이, 볼륨 게이트웨이, 테이프 게이트웨이
- Transfer Family: FTP, FTPS, SFTP 프로토콜 인터페이스를 필요로 하는 경우
- DataSync: 온프레미스에서 AWS 혹은 AWS에서 AWS로 데이터 동기화 스케줄이 필요한 경우
- Snowcone / Snowball / Snowmobile : 물리적으로 데이터를 옮겨야할 경우
'TIL > AWS' 카테고리의 다른 글
AWS 컨테이너 ECS, Fargate, ECR과 EKS (1) | 2023.06.03 |
---|---|
AWS 통합과 메시징: SQS, SNS, Kinesis, Active MQ (0) | 2023.06.01 |
AWS CloudFront (0) | 2023.05.30 |
AWS S3 보안 (0) | 2023.05.29 |
고급 Amazon S3 (0) | 2023.05.28 |