본문 바로가기
소비자에서 생산자 되기

범정부 데이터 분석 활용 역량 진단 온라인 진단 문제와 답

by 천상연인 2025. 5. 16.
반응형

공직자들이 주로 실시하는 범정부 데이터 분석 활용 역량 진단에서

교육을 실시한 후, 수료까지 완료하기 위한 문제와 답입니다.

 

 

1. 다음 중 강화 학습(Reinforcement Learning)의 사례로 가장 적절한 것은 무엇인가?

   ㅇ 고객 데이터를 기반으로 제품 추천 리스트 생성

   ㅇ  주식 시장 데이터 학습 후 미래 가격 예측

   ㅇ  로봇의 시행착오를 통한 미로 탈출 경로 학습

   ㅇ  의료 영상 분석을 통한 종양 양성/악성 분류

 

2. 생성형 AI 모델을 학습할 때 "프롬프트 튜닝(Prompt Tuning)"이란 무엇인가?

   ㅇ  모델의 파라미터를 직접 조정하여 성능을 높이는 기법

   ㅇ  모델의 입력프롬프트를 조정하여 원하는 출력을 유도하는 기법

   ㅇ  데이터를 수집하는 과정에서 정제된 데이터를 학습하는 기법

   ㅇ  AI모델이 과적합을 방지하기 위해 특정데이터를 무작위로 제거하는 기법

 

3. 다음 중 AI 시스템의 윤리적 위험을 선제적으로 방지하기 위해 개발 단계에서 반드시 포함해야 할 핵심 전략은 무엇인가?

   ㅇ  모델 배포 후 사용자 불만 접수 채널 운영

   ㅇ  다학제적 팀 구성 및 편향성 영향 평가(BIA) 수행

   ㅇ  초고속 연산이 가능한 GPU 클러스터 도입

   ㅇ  모든 의사결정 프로세스를 End-to-End 자동화

 

4. 생성형 AI 모델에서 "미세 조정(Fine-Tuning)"이 필요한 가장 적절한 상황은?

   ㅇ  AI모델이 기존 데이터를 학습했지만, 특정 도메인(예: 법률, 의료)에서 정확한 결과가 필요할 때

   ㅇ  AI모델의 계산 속도를 높이고 싶을때

   ㅇ  AI모델이 텍스트가 아닌 이미지 데이터를 생성해야 할 때

   ㅇ  AI모델의 기본 구조를 변경하고 싶을 때

 

5. ChatGPT의 기본적인 활용 기능이 아닌 것은?

   ㅇ  문서 요약 및 보고서 초안 생성

   ㅇ  번역 및 다국어 지원

   ㅇ  정형데이터(표,수치) 기반의 실시간 분석

   ㅇ  코드작성 및 오류 수정 지원

 

6. 생성형 AI의 대규모 도입 시 발생하는 환각(Hallucination) 현상을 체계적으로 해결하기 위한 최적의 전략은 무엇인가?

   ㅇ  모델 파라미터 수를 2배 증가시켜 정확도 극대화

   ㅇ  다중 AI 모델의 출력 결과를 투표 방식으로 선정

   ㅇ  RAG(Retrieval-Augmented Generation) + 인간 검토자 피드백 반복 병행

   ㅇ  출력 결과에 대해 사후 정규화(Normalization) 필터 강제 적용

 

7. 데이터 분석 기획에서 가설 설정의 목적으로 가장 적절하지 않은 것은?

   ㅇ   분석의 방향성 제시

   ㅇ   데이터 수집 범위 결정

   ㅇ   분석 결과의 객관성 보장

   ㅇ   비즈니스 인사이트 도출 가능성 탐색

 

8. 데이터 분석 기획에서 "가설 검정"을 고려해야 하는 이유로 가장 적절한 것은?

   ㅇ  데이터 패턴을 무작위로 찾는 과정에서 가설을 설정해야 한다.

   ㅇ  데이터분석 결과를 미리 예측하여 원하는 결론을 도출할 수 있도록 한다.

   ㅇ  데이터분석의 신뢰성을 높이기 위해, 검증가능한 가설을 기반으로 분석을 수행해야 한다.

   ㅇ  정책결정권자의 요구에 맞는 결과를 만들기 위해 가설을 사전에 조정해야 한다.

 

9. 다음 중 비정형 데이터를 수집하는 방법으로 가장 적절한 것은?

   ㅇ 관계형 데이터베이스를 활용한 질의문 작성

   ㅇ  웹 크롤링(Web Crawling)을 통해 텍스트 데이터를 추출

   ㅇ  고정된 설문지를 사용하여 응답 데이터를 저장

   ㅇ  CSV 파일을 통해 구조화된 데이터를 입력

 

10. 대규모 설문 조사를 통해 인구통계학적 편향을 최소화하면서 표본의 대표성을 확보하기 위한 가장 효과적인 방법은 무엇인가?

   ㅇ  소셜 미디어 플랫폼에 온라인 설문 링크 배포

   ㅇ  편의 표본 추출법(Convenience Sampling)으로 신속한 데이터 수집

   ㅇ 층화 추출법(Stratified Sampling) 적용 후 각 층별 비율에 맞게 할당

   ㅇ  응답자에게 인센티브 제공해 참여율 극대화

 

11. 데이터 분석에서 "결측값(Missing Value)"을 처리하는 가장 적절한 방법이 아닌 것은?

   ㅇ  평균 또는 중앙값으로 대체한다.

   ㅇ  결측값이 포함된 행을 삭제한다.

   ㅇ  결측값을 임의의 랜덤 값으로 채운다.

   ㅇ  머신러닝 모델을 이용하여 결측값을 예측하여 대체한다.

 

12. 머신러닝 모델의 성능을 평가할 때 일반적으로 사용되는 지표가 아닌 것은?

   ㅇ  정확도(Accuracy)

   ㅇ  재현율(Recall)

   ㅇ  MSE(MeanSquaredError)

   ㅇ  피어슨상관계수(PearsonCorrelationCoefficient)

 

13. 데이터 분석을 활용한 정책 효과를 평가하는 가장 적절한 방법은?

   ㅇ  데이터분석 결과만으로 정책의 성공여부를 판단한다.

   ㅇ  정책시행 전후 데이터를 비교하고, A/B테스트와 같은 실험적 방법을 활용한다.

   ㅇ  정책이 성공했다는 가정을 바탕으로 데이터를 분석한다.

   ㅇ  분석결과와 상관없이 정책을 지속적으로 유지한다.

 

14. 데이터 분석 결과가 통계적으로 유의미하다는 의미는 무엇인가?

   ㅇ  분석결과가 반드시 실 생활에서도 동일하게 적용된다는 의미

   ㅇ  두변수 간 상관관계가 항상 존재한다는 의미

   ㅇ  분석결과가 우연에 의한 것이 아니라 통계적 기준을 만족한다는 의미

   ㅇ  분석결과를 그대로 적용해도 문제 될 가능성이 없다는 의미

반응형