[1교시형]
1. 시계열 분석 : 연도별, 분기별 등 시계열로 관측되는 자료를 분석하여 미래를 예측하기 위한 분석 기법
- 시계열 분석 절차 : 시계열 데이터 특성 분석 > 정상성 시계열 변환 > 시계열 모형 식별과 추정 > 모형 생성 > 미래 예측
- 정상성 개념 및 조건
개념 : 시점에 관계없이 평균값 중심으로 일정한 변동폭을 갖는 시계열
조건 : 평균 일정, 분산에 의존하지 않음
- 시계열 모형 유형
자기 회귀 모형(AR, Auto-Regressive Model)
이동 평균 모형(MA, Moving Average Model)
자기 회귀 누적 이동평균 모형(ARMA, Auto Regressive Moving Average Model) : AR + MA 혼합 모형
- 시계열 분해 요인
추세 요인 : 자료가 어떤 특정한 형태를 취함
계절 요인 : 고정된 주기에 따라 자료가 변화할 경우
순환 요인 : 알려지지 않은 주기를 가지고 자료가 변화하는 요인
불규칙 요인 : 요인을 설명할 수 없는 잔차에 해당하는 요인(white noise)
2. 저궤도 위성 : 지상 300~1500km에 수백 기 이상의 대량 생산된 통신 위성을 배치하여 초고속, 저지연 인터넷 서비스를 제공하는 통신시스템
- 특징 : 통신 커버리지 확대, 낮은 전파 인식 및 통신 지연율 --> 음영지역 네트워크 구축 불필요
- 구성요소 : 우주(위성 탑재체>우주 기지국 역활 및 사용자 무선 액세스 제공), 지상(저궤도 위성 게이트웨이>여러 개의 위성과 동시에 연결 수행), 유저(차량, 모바일, PC등의 디바이스> 위성통신 서비스 사용자) --> 스페이스 X, 텔레샛, 원웹, 아마존 등 향후 46,100개 발사 계획
- 저궤도(LEO), 중궤도(MEO), 정지궤도(GEO) 비교
3. IT 투자성과 평가 : IT 생산성 패러독스를 극복하기 위해 투자에 대한 목표, 기여도, 품질 등을 정성적/정량적으로 평가하는 활동
- 필요성 : IT 투자 비 가시화 극복, 생산성 패러독스
- 정량적 평가 : ROI(투자수익율), NPV(순 현재가치), IRR(내부 수익율), PP(회수기간)
- 정성적 평가 : Value Chain, BCG Matrix, IO(Information Orientation, 정보화 평가), IE(Information Economics,정보경제학)
--> 재무적/비재무적 지표를 동시에 고려한 다중접근 방식인 IT BSC 통한 평가 필요
4. SDP(Software Defined Perimeter), 제로 트러스트 구현을 위한 SDP
- 정의 : 인프라 자원 접근시 인증 권한을 유무를 확인하여 IPSec Tunnel 통해 액세스를 허용하는 선 인증 후 연결 접근통제 프레임워크
- 구성요소 : SDP Agent(SPA, Single Packet Authorization, PKI, SAML, OAuth), SDP Gateway(mTLS, DTLS), SDP Controller(제로트러스트, LDAP, AD, RBAC)
5. IPC(Inter Process Communication), 프로세스간 정보 교환(Process 끼리 대화를 하는 것)
- 정의 : 독립된 프로세스를 사이에 자원, 정보공유 및 교환 등을 위하여 서로 데이터를 주고 받는 행위
- 통신 방식
Messgae Queue : 커널 내 Message Queue를 이용하여 메시지 전달 통신 방식
Share Memory : 두 개 이상의 프로세스가 특정 메모리 영역 공유 방식
Semaphore : 여러 프로세스 공유 자원 접근시 P, V 연산으로 접근 제어 방식
PiPe : 익명의 PIPE를 통해 동일한 PPID를 가진 프로세스 간 통신을 지원
Named Pipe : 이름을 가진 PIPE를 통해 프로세스들 간 단방향 통신 지원
Soket : 네트워크 소켓통신을 이용하여 원격 프로세스간 데이터 공유 방식
Signal : 커널 또는 프로세스에서 이벤트 발생을 알려주는 기법
6. 데이터모델링, 현실세계의 추상화
- 정의 : 사용자 요구사항 분석을 통해 개념모델, 논리모델, 물리모델로 표한하는 추상화 기법
- 기본원칙 : 커뮤니케이션 원칙, 모델링 상세화 원칙, 논리적 표현 원칙
- 데이터 모델링 절차
개념모델링 : 주제영역(업무상 친물도가 높은 데이터 집합), 핵심엔티티(업무 영역 내에서 관리하고자 하는 핵심엔터티 정의), 핵심관계(핵심 엔터티의 논리적관계)
논리모델링 : 엔터티 정의, 관계 정의(M:M해소), 속성 정의(정보 항목), 식별자 확정(유일성 보장), 정규화(이상현상 제거), 이력관리(히스토리용 엔티티 생성)
물리모델링 : 엔티티-테이블 전환(슈퍼타입, 서브타입, 개별), 속성-칼럽 변환(속성을 칼럼으로 변환, PK, UK 전환), 관계 전환(1:1. 1:M에 대한 관계 정의), 반정규화(수평/수직 분할, 중복테이블, 중복 칼럼 생성
--> 물리 모델링 이후 저장공산, 용량산정, 이중화 등의 물리데이터베이스 설계 수행
물리데이터베이스 설계 기법 : 파티션 설계, 분산DB성계, 인덱스 설계, 무결성 설계
7. 임베딩 : 자연어를 기계가 이해할 수 있도록 벡터형태로 변경하는 기술
- 유형
단어기반 : Word2Vec(CBOW, Skip-gram), Fast Text(문자 단위 n-gram), Glove(단어 유사도 측정)
문장기반 : ELMO(Pre-Trained 양방향 LSTM이용), LDA(핵심주체 찾기)
혼합형 : LSA(차원 축소 행렬 비교)
- 자연어 처리 임베딩 절차 : 텍스트 셋 > 전처리(불용어 제거, 결측값/이상치 제거) > 토근화 > 벡터화 > 활용(감정분석, 문장요약, 주제분류)
--> 임베팅을 수행하여 생성된 벡터는 언어모델을 통해 학습되며 문장 예측, 감정분석, 문장요약 등에 활용
8. ANOVA : 서로 독립적인 집단이 셋 이상인 경우, 집단간 평균 차이를 확인하기 위해 F검정을 이용하는 검증방법
- 특징 : 정규성, 등분산성, 독립성 --> T-Test 를 여러번 사용함에 따라 나타나는 Type1 Error Inflation 현상 개선
- 유형 : One Way ANOVA, Repeated Measures ANOVA, Two Way ANOVA, Multi Way ANOVA, Multivariate ANOVA
- F-Test
정의 : 두 모집단의 분산에 대한 차이가 통계적으로 유의한가를 판별하는 검정기법
F 검정량 : 두 집단의 샘플 분사의 비율, 집단 간 분산/집단 내 분산
- ANOAVA 이후 후속 검정(Post-Hoc / Multiple comparisons)
개념 : ANOVA 수행 후 어떤 집단간의 차이가 존재하는지를 확인하는 기법
주요 사후 검정 : Turkey, Scheffe, Games-Howell
9. NewSQL, RDBMS의 ACID와 NoSQL의 확장성 결합
- 개념 : 무결성 지원 위해 RDBMS의 ACID 보장하면서 NoSQL의 성능과 확장성 제공하는 DBMS
- 특징 : Full ACID 지원(트랜잭션 완벽 지원, 직렬화 제공), Fault Tolerance(수평확장, 스토리지 서버 독립적 확장)
--> Full ACID 지원 및 Scale-Out 가능 Shared Nothing 아키텍처
- 핵심기술
RDBMS측면 : MVCC(동시성 제어), Sharding(DB 분산저장), Indexing(검색속도향상), ACID 완벽 지원
NoSQL측면 : Schemaless(Key/Value기반), In-Memory(고성능/저지연 대량 데이터 처리), DB Scaling(유연한 Scale-Out 확장)
- 3단락 : NewSQL(Google Spannde, VoltDB, MemSQL), NoSQL(MongoDB, HBASE, Redis, Cassandra), RDBMS(Oracle, MSSQL, MySQL)를 비교(스키마, 확장성, 고가용성, ACID특성, BASE특성 구분으로 비교
10. 민간투자형 SW사업(사례, 서울시 교통카듸스템, 스마트 어린이급식 통합관리시트템)
- 개념 : 국민생활 편익 증진을 목적으로 민간의 자본과 기술을 활용하여 추진하는 민관협력형 SW사업
- 근거 : 소프트웨어진흥법 제40조
- 필요성 : 소프트웨어진흥법 개정, 공공SW사업혁신, 민관협력 고부가가치 창출
- 유형
개발형 : 임대형(50% 민간 투자, 발주기관이 임대료 지급, BTL방식), 수익형(50% 민간 투자, SW이용자가 사용료 지급, BTO방식)
[참고] BTO(Build Transfer Operate) : 사업자는 시설관리 운영권을 보유하면서 사용자로부터 사용료를 징수
[참고] BTL(Build Transfer Lease) : 사용료 대신 국가나 지자체로 시설 임대료 받는 형식
구매형 : 이미 개발된 상용 소프트웨어 구매(공공기관이 SW사용료 지급)
- 제도적 이점 : SW영향평가 대상 제외, 대기업 참여제한 예외(평등 참여), 사용소프트웨어 직접구매 대상 제외(분리발주 없이 턴 키 구축), ISP 수립 면제
11. DMARC(Domain-based Message Authentication, Reporting and Conformance), 안전한 이메일 사용기술 RFC 7498
- 개념 : 메일서버 등록 방식인 SPF와 도메인 키 인증 메일인 DKIM을 통해 의심메일 차단 메일 리포팅 기술
- 구성요소 :
DMARC 인증 측면 : SPF(Sender Policy Framework,인증된 서버 확인 기술), DKIM(DomainKeys Identified Mail, 이메일 무결성/인증 기술), RUA(Reporting URI for Aggregate, DMARC 보고서 발송 역할)
DMARC 레코드 측면 : P(DMARC 미인증 메일 처리), aspf(SPF 문자열 설정), adkim(DKIM 문자열 설정)
12. 모니터 동기화, 프로그램 언어 수준의 동기화 기법
- 개념 : 세마포어 단점인 타이밍 문제 해결을 위해 프로그램 언어 수준에서 상호배제를 구형하여 동기화 제공하는 기법
- 필요성 : 타이밍 문제 해결, 언어 수준의 편의성
- 기술요소 :
동기화 요소 : 임계영역, 베타동기 큐, 조건동기 큐
언어 요소 : synchronizzed 베타동키 큐로 진입, wait()조건동기 큐로 진입 후 스레드 lock, nitify(), notiryAll() 조건동기 큐 깨워 임계영역 재진입
13. Watchdog Timer
- 개념 : 프로그램이 무한 루프에 갇히거나 비정상 상황 등 오류 상황 회피를 위한 전자 타이머
- 필요성 : 제어 실패 방지 매커니즘 필요
- 구성요소 : KICK(주기적 알려주는 Alive신호), RESET(MCU 초기화), CLOCK(디바이스 동작 소스), Timeout(타임아웃 발생 시그널)
--> 하드웨어 고장으로 인한 WDT상황이면 계속 리셋 발생 가능, 이러한 이유로 재설정 횟수등의 기법으로 제어
- 워치독 타이머 종류
* 모듈별 유형
단단계 워치독 타이머 : 단일 모듈로 구성되어 CPU 이상 동작 시 재시작
다단계 워치독 타이머 : 다중 모듈로 구성되어 개별 대응 기능 구현
* 위치별 유형
내부 워치독 타이머 : MCU 내부에 위치, 별도 비용 없음, 상대적 신뢰도 낮음
외부 워치독 타이머 : MCU 외부에 위치, 별도 비용 필요, 상대적 신뢰도 높음
[2교시형]
1. ISP/ISMP 수립 공통가이드 제7판
- 개정사항
범위 확대 : 현행 제6판에서는 클라우드 컴퓨팅 등 디지털 서비스 도입/접환 우선 검토 --> 개정 제7판에서는 디지털플랫폼정부 기본원칙 적용 우선 검토
--> 사유는 정부 핵심 추진 과제 반영
수립 제외 : 현행 제6판에서는 ISP/ISMP 수립 제외 유형 제시 --> 유형별 세부 사례 추가
--> 사유는 빈번한 문의사항 설명 명확화
- 수립 제외 유형
개발 및 유지보수 측면 : 단순시스템 도입, 단순기능 개발, 운영/유지
시스템 구축 측면 : 단순물품 구매, 단순시설 구축, DB구축
제도척 측면 : 민간투자형 SW사업
--> ISP/ISMP 수립의 실익이 낮다고 인정되는 경우 기획재정부와 사전 협의를 통해 수립 제외
- 산출물 검토 :
신출물 대상 : 검토 신텅서, 최종산출물, 비용산출근거
산출물 검토 분야 : 총 4개 분야 6개 구성항목에 대해 검토
사업타당성(필요성, 시급성, 중복성), 실현가능성(사업추진 여견, 기술 적정성), 디지털플랫봄정부 기본원칙 적용, 규모 적정성(총구축비 적정성)
디지털플랫폼정부 기본원칙 : 클라우드 우선, 국민 중심, 하나의 정부, AI 데이터 기반, 민관렵력
검토 기관 : 기획재정부와 한군지능정보사회진흥원(NIA)
2. 1) 머신러닝 파이프라인
- 개념 : 머신러닝 기술을 활용하기 위해 초기 기획부터 데이터 수집/가공/분석과학습 위한 머신러닝의 전체 과정
- 절차
1) 머신러닝 데이터 수집 : 스크랩핑, Crawler 이용 정형/비정형 수집
2) 머신러닝 모델 생성 : 데이터 전처리(이상치, 결측치), 데이터 분할(Training, Test, Validation 분할), ML모델 학습(선형 회귀, 로지스틱회귀, SVM, CNN 수행), 모델평가(F1-Score, MAE, RMSE)
3) 머신러닝 모델 검증 : Training, Validation 셋을 이용 Cross Validation 수행
4) 머신러닝 모델 테스트 : TEST데이터 셋 이용 최종 평가
5) 머신러닝 활용 : ML모델 배포, ML API 서비스(Restful 이용)
--> 모델 학습 단계에서 학습 시간이 너무 짧거나 긴 경우 성능이 떨어지는 언더피팅, 오버피팅 증상 발생 가능
2) 언더피팅 : 머신러닝 학습 시 데이터의 특징을 제대로 학습하지 못하여 머신러닝 모델 학습 단계와 모델 테스트 단계에서 성능이 떨어지는 현상
- 원인 : 데이터가 적은 경우, 모델이 간단한 경우, Epoch가 작은 경우
- 해결방안 : Feature 증가, Variance가 높은 머신러닝 모델 변경, 충분한 Epoch설정
--> 과도하게 학습이 수행될 경우 학습데이터 이외에는 모델이 잘 동작하지 않는 오버피팅 발생 가능
3) 오버피팅 : Trarning 데이터셋의 특징에 집중적으로 학습하여 학습시 성능은 우수하지만 테스트 단계에서는 성능이 낮게 나오는 현상(노이즈까지 학습)
- 원인 : 차원의 저주, 학습데이터 부족, 데이터 편향, 모델 복잡성
- 해결방안 : Cross Validation, 정규화, Dropout, Early Stopping, 학습 데이터 증가
- Cross Validation : Hold out, K-fold, Leave-one-out, Leave-p-out
3. QoS
- 개념 : 한정된 네트워크 망의 대역폭을 효율적으로 사용하게 하고 트래픽을 정책별로 제어하여 종단간 서비스 품질을 향상시키는 기술
- QoS 구성
QoS기술 : Queuing, Polishing, Shaping
- Queuing : FIFO(순차적), PQ(우선순위), CQ(라운드로빈), WFQ(라운드로빈 가중치), CBWFQ(클래스별 정책 정의)
- Policing : Tail Drop(Full시 신규 패킷 Drop), RED(랜덤 Drop), WRED(가중치 부여 Drop)
- Shaping : Leaky Bucket(데이터율을 평균으로 고정), Token Bucket(토큰 부여하여 버스트 트래픽 허용)
QoS모델 : IntServ, DiffServ, MPLS, CDN
- IntServ : 유입되는 패킷을 사전 분류 후 RSVP를 통해 자원을 예약하는 QoS 모델, Best-Effort Service, 소규모 네트워크 적합
- DiffServ : DS필드 및 PHB를 정의하여 서비스 제공 유형을 DSCP로 구분하여 서비스하는 QoS모델, 대규모 네트워크 적합
구성요소 : DSCP(Differentiated Service code Point) - 모든 IP헤더에 DSCP 붙임
PHB(Per-Hop_Behaviour) : 패킷을 수신하는 홉 단위 동작
QoS측정요소 : 대역폭, 패킷손실, 지연, 지터
4. 어텐션 메커니즘
- 개념 : 모든 기억을 동등하게 기억하지 않고 연관성 있는 기억에 집중하여 기억하도록 구조화하는 방법
- 등장배경 : RNN기반 Seq2seq모델의 문제인 장기의존성 문제
- 원리 : Attention Value는 Query와 Key의 유사도를 구하고 이 유사도를 반영하여 value에 적용한 값
- 기본 이론 : Key - Query - Value , Attention(Q, K, V) = Attention Value
- 어텐션 매커니즘
어텐션 함수 : 스코어 함수, 인토더의 모든 은닉상태가 디코더 현시점 은닉상태의 유사도를 Score로 표현)
어텐션 값 : 집중분포의 가중치를 각 인코더의 은닉상태에 가중합해서 최종 Attention Value를 구함
5. IT 인프라 유형 및 VM과 Container 비교
- 기존 IT 인프라 아키텍처 : 집약형 아키텍처, 분할형 아키텍처, 서버-클라이언트 아키텍처(2, 3 - tier), 단순 수평 분할형 아키텍처, 공유형 아키텍처
--> 빠른 비즈니스 환경에서 신속성이나 유연성, 비용 절감 문제등이 발생하여 새로운 가상화 기술을 통해 새로운 기회 확보
- 현대 IT 인프라 아키텍처 : 가상머신(Virtual Machine), Container
가상머신 : 하이퍼바이저를 사용하여 물리적 서버 자원을 추상화하여 여러 Guest OS지원하는 가상화 기술
구성요소 : 하이퍼바이저, Host OS, Guest OS
가상화 방식 : 전가상화, 반가상화
Guest OS : 다양한 OS 선택 가능
구동 시간 : 수분
성능 : 성능 오버헤드, VM개수만큼 라이선스 필요
아키텍처 : 모놀리식 서비스 적합
보안 : 개별 VM의 안정적, 독립적 운영
상용제품 : VMware, Virtual Box
컨테이너 : LXC기반 컨테이너 엔진으로 어플리케이션에 자원을 공유 및 격리하여 제공하는 가상화 기술
--> 컨테이너는 한 OS를 공유하는 구조이고 VM은 각각의 OS를 설치하는 구조이므로 컨테이너가 성능적 빠름
구성요소 : LXC, Namespace, Cgrounds, Livcirt
가상화 방식 : LXC 기반 컨테이너 방식
Guest OS : 호스트 OS와 동일한 OS
구동 시간 : 수초
성능 : 가법고 빠른 실행
아키텍처 : MSA 적합
보안 : 호스트 OS장에시 영향 받음
상용제품 : DOCKER, RXT, LXC
6. NoSQL
- 개념 : 스키마 없이 분산 환경에서 단순 검색 및 추가 작업이 용이하고 지연과 처리율이 높은 DBMS
- 특징 : Schemaless, 비정규화, 트랜잭션 보장 지원
- 유형 : Key/Value, Key/Column,
- 모델링 패턴 : Denomalization, Aggregation, Application Sile Join, Atomic Aggregation, Index Table, Composite Key [디아싸아인컴]
- 모델링 절차 : 도메일 모델 파악, 데이터 출력형태 디자인, 패턴 이용 메이터 모델링, 최적화 필요 기능 나열, 후보 NoSQL 선정 테스트, NoSQL 최적화 H/W디자인
'ITPE > 비상반 주간모의고사' 카테고리의 다른 글
2주차(2023.09.23) 주간 모의고사 (1) | 2023.09.25 |
---|