new stata 16

More



이번 Stata 16은 모든 메뉴를 한글로 작업했습니다.
국내 유저들이 Stata를 좀 더 쉽게 사용할 수 있도록 하였으며
머신러닝을 위한 명령어들 도입하고 다양한 인터페이스와
리포팅 기능을 강화했습니다.
이번 버전에서 도입된 주요 특징들은 다음과 같습니다.

새로운 Stata 16의 특징

New Stata 16

100
FAST
100
ACCURATE
100
EASY

  • 라쏘 Lasso
  • 향상된 리포팅 Advanced Reporting
  • 메타분석 Meta-analysis
  • 선택모형 Choice models
  • 파이썬 통합 Python integration
  • 새로운 베이지안 분석 New in Bayesian analysis - 다중체인, 예측치 저장 등
  • 패널데이터 확장회귀모형 Panel-data ERMs
  • SAS 및 SPSS 데이터 불러오기 Import data from SAS and SPSS
  • 비모수 계열 회귀 Nonparametric series regression
  • 다중 데이터 관리 Multiple datasets in memory
  • 신뢰구간 계산을 위한 표본크기 분석 Sample-size analysis for CIs
  • 비선형 DSGE 모형 Nonlinear DSGE models
  • 다중집단 IRT 모형 Multiple-group IRT models
  • 다중-투여량 약물동태 모형 Multiple-dose pharmacokinetic modeling
  • 이산적 서열프로빗 모형 Heteroskedastic ordered probit models
  • 그래프 크기 조정 Graph sizes in printer points, centimeters, and inches
  • 수치적분 Numerical integration
  • 선형 프로그래밍 Linear programming
  • 한글메뉴 · 다이얼로그 지원 Stata in Korean
  • Mac 지원강화 Dark Mode and native tabbed windows
  • Do-파일 편집기 기능강화 Autocompletion and more syntax highlighting

New Stata 16

Our Feautrue
alt
alt

라쏘는 모형의 선택, 예측과 추론에 활용되는 기계학습 방법입니다.

 

새로운 라쏘 명령어에서는 선형, 포아송, 로짓 혹은 프로빗 회귀모형으로부터 도출되는 적합통계량을 통해 연속형, 빈도형, 이분형 종속변수에 대한 “최적” 예측치를 선택합니다. 예를 들어, 아래 명령어를 실행하면

 

. lasso linear y x1-x21

 

라쏘는 공변량에 해당하는 x2, x10, x11, x21의 하위조합을 구성하고 선택합니다. 연구자는 y의 예측치를 얻기 위한 predict 명령어를 사용할 수 있습니다.

 

만약 연구자가 연속형이 아닌 이분형이나 빈도형 종속변수를 가지고 있다면, 연구자는 라쏘로짓, 라쏘프로빗 혹은 라쏘포아송 모형을 동일한 방법으로 사용할 수 있습니다. 그리고 엘라스틱 넷(elastic net)이나 제곱근 라쏘방법을 선호한다면, 연구자는 elasticnet이나 sqrtlasso 명령어를 사용할 수 있습니다.

 

때때로, 변수의 선택이나 예측이 라쏘의 최종목표일 때가 있습니다. 다른 경우에는 연구자가 계수추정이나 계수검정에 관심을 가집니다. Stata 16은 계수, 표준오차, 신뢰구간 등의 추정을 제공하며 통제변수들 사이에 라쏘를 통한 변수선택과 동시에 관심변수에 대한 통계적 검정을 수행할 수 있는 11가지의 명령어를 제공합니다. 명령어는 아래와 같습니다.

 

dsregress, dslogit, dspoisson, poregress, pologit, popoisson, poivpoisson, xporegress, xpologit, xpopoisson, and xpoivregress.

 

ds 명령어는 이중선택 라쏘, po 명령어는 부분출력 라쏘, xpo 명령어는 교차적합 부분출력 라쏘를 수행합니다. 언급한 명령어들은 연속형, 이분형, 빈도형 종속변수에 모두 적용할 수 있습니다. 또한 연속형 종속변수를 다루는 모형에서는 내생적 공변량을 다를 수 있습니다. (* partialling-out: 도구변수 방식으로 독립변수들 간의 회귀식을 설정하고 오차항을 독립변수로 y를 추정하여 관심변수의 교란부분을 소거한 후 추정)

 

최근 연구들은 라쏘기반 통계적 추론에 대한 많은 방법을 논의하고 있습니다. Stata 16에서는 연구자들이 선호하는 방법을 선택할 수 있도록 통계적 추론과 관련한 많은 방법들을 제공합니다. 사실, 연구들을 위한 더 많은 라쏘기반 추론 방법론이 있으며, 연구자들은 lasso, sqrtlasso, elasticnet를 이용하여 다양한 방법으로 접근이 가능합니다.

 

lassoelasticnet 명령어는 변수선택과 예측과 관련하여 가장 기준이 되는 명령어입니다. 통계적 추론을 위한 라쏘 도구는 경제학자들에 의해 처음 개발된 방법보다 더 새로운 방법을 제공합니다. 그러나 이러한 통계적 추론방법은 관심변수의 계수해석과 통계적 검증을 위한 방법을 제공하기 때문에 모든 분야에서 일반적인 방법이 될 것입니다.

 

새롭게 제공되는 ‘Lasso Reference’ 매뉴얼을 통해 라쏘와 관련한 모든 내용에 대해 학습할 수 있습니다.

alt

리포팅 기능은 Stata의 결과와 그래프, 서식이 적용된 텍스트, 표를 Word, PDF, Excel, HTML 문서로 통합하여 생성합니다. 사용자가 생성하는 문서의 형식에 관계없이, Stata의 통합된 버전관리 기능을 통해 사용자는 보고서를 재산출 할 수 있습니다.

 

Stata의 리포팅 기능은 자료변화에 따라 내용이 반영되는 동적보고서 기능을 지원합니다. 동적보고서의 생성은 Stata에서 쉽게 수행할 수 있습니다. 리포트 생성 명령어나 do-파일을 새로운 자료와 함께 수행하면, 보고서 내 Stata의 모든 결과는 자동적으로 갱신되어 반영됩니다.

 

Stata 16에서는 이전보다 새롭고 향상된 리포팅 기능을 제공합니다. 모든 Stata의 보고서 기능은 새롭게 제공되는 Reporting Reference 매뉴얼을 통해 작업흐름과 관련한 새롭고 다양한 예제와 Word, PDF, Excel, HTML 문서를 생성하는 도움말을 제공합니다.

 

Stata16에서 새롭게 추가된 보고서 기능은 아래와 같습니다.

 

  • dyndoc, markdown 명령어가 이전버전에서 HTML 문서를 지원하였던 것에 추가적으로 Word 문서를 지원합니다. 이제 사용자는 Stata의 모든 결과와 그래프를 서식이 적용된 형식으로 Word 문서로 쉽게 통합할 수 있습니다.

 

  • Do-파일 편집기에서 명령어 강조 및 마크다운 구문강조 기능을 제공합니다.

 

  • putdocx 명령어가 머리말, 꼬리말, 문서 페이지번호를 Word 문서에 포함시킬 수 있습니다. 또한 긴 길이의 빈 공백 텍스트를 생성할 수 있습니다.

 

  • html2docx 명령어는 CSS가 적용된 HTML 문서를 Word 문서로 변환할 수 있습니다. docx2pdf 명령어는 Word 문서를 PDF문서로 변환합니다.
alt

Stata 16은 메타분석을 수행하기 위한 새로운 명령어패키지를 제공합니다. 이러한 명령어는 서로 다른 연구들의 결과를 탐색하거나 통합하는데 활용됩니다. 예를 들어 만약 혈압에 영향을 미치는 특정한 약의 효과에 대한 20개의 연구결과를 수집하였다면, 연구자는 메타분석을 통해 연구들을 요약하고 전체효과를 추정할 수 있습니다.

 

새로운 meta 명령어는 많은 기능을 담고 있으나 개별적인 설정은 매우 간단합니다.

 

예를 들어, 사용자가 아래와 같이 입력하여

 

. meta set effectsize stderr

 

효과크기 계산을 위한 설정을 하거나, meta esize를 사용하여 수집자료로부터 효과크기를 추정합니다. 이와 함께 연구자는 확률효과(random-effects), 고정효과(fixed effects), 혹은 공통효과(common-effect)를 추정할 수 있습니다. 전체 효과크기 및 효과크기의 신뢰구간을 추정하거나, 이질성과 관련한 통계량을 얻거나, 그 밖에 다른 작업을 수행하려면, 연구자는 간단히 아래와 같이 입력하면 됩니다.

 

. meta summarize

 

그리고 결과를 시각화하려면 간단히 아래와 같이 입력하면 됩니다.

 

. meta forestplot

 

그러나 meta 명령어는 지금까지 소개한 기능만 제공하는 것은 아닙니다.

 

연구들의 이질성을 평가하고 분석하기 위한 메타-회귀분석과 하위집단 분석을 제공합니다. 이러한 분석은 meta regress, meta forestplot, subgroup() 혹은 meta summarize, subgroup() 명령어를 통해 수행 가능합니다.

 

연구자는 또한 출판편의(publication bias)를 진단할 수 있습니다. meta funnelplot 명령어는 깔때기 그림(funnel-plot)을 출력하고 이를 통해 비대칭성을 시각적으로 확인할 수 있으며, meta bias 명령어는 깔때기 그림의 비대칭성에 대한 통계적인 검증을 수행합니다. 그리고 절삭과 채움(trim-and-fill) 방법은 meta trimfill 명령어를 통해 수행할 수 있습니다.

 

추가적으로, 사용자는 누적 메타분석을 meta summarize, cumulative() 명령어를 통해 수행할 수 있습니다. 모든 메타분석과 관련한 기능은 새롭게 제공되는 ‘Meta-analysis Reference’ 매뉴얼에서 확인 가능합니다.

alt

Stata 16는 선택자료(choice data) 모델링을 위한 통합된 명령어를 새롭게 제공합니다. 선택자료의 요약 및 추정을 위한 새로운 명령어가 추가되었으며, 기존 명령어의 기능향상과 더불어 통합환경을 제공하기위해 이름을 변경하였습니다. 패널자료에 적합한 혼합 로짓선택 모형도 새롭게 추가되었습니다. 그리고 ‘Choice Models Reference’ 매뉴얼이 새롭게 제공됩니다.

 

그리고 새로운 내용 중 가장 눈에 띄는 부분은, 선택모형 추정 후 margins 명령어를 적용할 수 있다는 것입니다. 이는 사용자가 추정한 선택모형에 대한 결과를 쉽게 해석할 수 있다는 것을 의미합니다. 선택모형에서 추정된 계수는 해석이 어려웠으나, margins 명령어를 통해 연구자가 모형 결과에 기반하여 매우 구체적인 질문과 답변을 할 수 있게 합니다.

교통수단 선택 모형을 예로 들면, 사용자는 아래와 같은 연구 질문을 던질 수 있습니다.

 

  • 비행기를 선택하는 여행자의 기대 비율은 어떨까?
  • 소득이 $10,000 증가하면 여행교통수단으로 자동차를 선택할 확률은 얼마인가?
  • 만약, 공항 대기시간이 30분이 증가하면, 다른 교통수단 선택에 어떠한 영향을 미치는가?

 

이밖에 달라진 것은 사용자가 선택모형을 추정하기 전에 cmset을 먼저 실행해야 한다는 점입니다. 예를 들어,

 

. cmset personid transportmethod

 

위의 명령어를 실행한 이후에 cmsummarize, cmchoiceset, cmtab, cmsample 명령어를 사용하여 자료의 탐색, 요약, 그리고 자료가 가진 잠재적인 문제에 대해 분석할 수 있습니다.

 

그리고 사용자는 아래의 선택모형을 cm 추정명령어를 통해 수행할 수 있습니다:

 

  • 조건부 로짓 선택모형 cmclogit conditional logit (McFadden’s choice) model
  • 혼합로짓 선택모형 cmmixlogit mixed logit model
  • 패널혼합로짓 선택모형 cmxtmixlogit panel-data mixed logit model
  • 다범주 프로빗 선택모형 cmmprobit multinomial probit model
  • 순위서열 프로빗 선택모형 cmroprobit rank-ordered probit model
  • 순위서열 로짓 선택모형 cmrologit rank-ordered logit model

 

다른 명령어와 달리 cmxtmixlogit는 이름이 변경되었을 뿐만 아니라 기능적 향상이 되었습니다. Stata 16에서 완전히 새롭게 설계되었으며, 패널자료를 위한 혼합로짓 선택모형을 추정할 수 있습니다.

alt

Stata 16에서 사용자는 Stata안에서 파이썬 코드를 실행하고 포함할 수 있습니다. Stata의 새로운 python 명령어는 쉽게 Stata에서 파이썬을 코드를 호출할 수 있으며, Python의 결과를 Stata안으로 불러들일 수 있습니다.

 

사용자는 파이썬 언어의 확장된 기능을 활용하기 위해 파이썬과 직접 상호작용하거나 do-파일과 ado-파일에 코드를 입력할 수 있습니다. 또한 사용자는 Stata에서 파이썬 스크립트 파일(.py)를  직접 실행할 수 있습니다.

 

추가적으로,  Stata함수인터페이스(sfi) 파이썬 모듈을 설명하면, 모듈은 Stata와 파이썬 간 양방향 연결을 제공합니다. 이 모듈은 Stata의 현재자료, 프레임, 매크로, 스칼라, 매트릭스, 값 라벨, 변수특성, 전역적 Mata 매트릭스 등을 접근할 수 있게 합니다.

 

이는 사용자가 파이썬의 모든 패키지를 Stata에서 직접 사용할 수 있다는 것을 의미합니다. 예를 들어 사용자는 Stata에서 3차원 그래프를 그리는 Matplotlib 파이썬 패키지를 사용할 수 있고, Scrapy를 통해 웹에서 자료를 스크랩 할 수 있습니다. 또한 인공신경망과 서포트 벡터머신과 같은 기계학습 기법을 텐서플로나 scikit-learn를 통해 접근할 수 있습니다.

 

끝으로 Stata의 do-파일 편집기에서 파이썬 언어의 구문강조 기능을 제공합니다.

 

고급사용자와 프로그래머들은 파이썬과의 통합을 통해 큰 이점을 얻게 되는 동시에, Stata 내 파이썬을 사용할 수 있다는 점은 모든 분야의 사용자에게 매우 흥미로운 지점이 될 것입니다.

alt

다중체인:

MCMC 표본을 기반으로 한 베이지안 추론은 마코프 체인이 수렴하는 경우에만 결과가 타당합니다. 이러한 수렴조건을 평가하는 유일한 방법은 시뮬레이션과 다중체인을 비교하는 방법입니다. 이러한 다중체인을 구성하는 nchains() 옵션이 bayes:bayesmh 명령어에 새롭게 추가되었습니다. 예를 들어 아래와 같이 입력하면 4개의 체인이 생성됩니다.

 

. bayes, nchains(4): regress y x1 x2

 

체인은 더 정확한 결과를 산출하기 위해 최종결과에 통합될 것입니다. 결과를 해석하기 전에 연구자는 수렴과정과 관련하여 체인을 시각적으로 비교할 수 있습니다. 또한 bayes: regress 명령어와 다른 베이지안 추정 명령어를 통해 다중체인을 시뮬레이션 할 때, Gelman–Rubin 수렴진단 결과를 리포트하여 과정을 평가할 수 있습니다. 추정 시 수렴하지 않는 문제가 발생한 경우, 연구자는 bayesstats grubin 명령어를 사용하여 추정한 모형의 개별 모수에 대한 Gelman–Rubin 진단을 수행할 수 있습니다.

 

베이지안 예측치:

베이지안 예측치는 사후예측 분포로부터 시뮬레이션된 값입니다. 이러한 예측치는 모형적합도 평가와 표본 외 관측치 예측에 유용하게 활용할 수 있습니다. 연구자는 Bayesmh 명령어로 모형을 추정한 이후에 bayespredict 명령어를 활용하여 시뮬레이션된 예측값이나 함수를 계산하고 Stata 자료로 저장합니다. 예를 들어 아래와 같이 입력하면 시뮬레이션된 값의 최소값과 최대값을 계산합니다.

 

. bayespredict (ymin:@min({_ysim})) (ymax:@max({_ysim})), saving(yminmax)

 

그리고 bayesgraph와 같은 사후추정 명령어를 활용하여 예측치의 요약통계량을 얻을 수 있습니다.

 

bayespredict를 통해 생성한 자료는 분석자료 내 관측치를 수천 번 시뮬레이션한 값이 저장되어 있을 것입니다. 때때로, 사용자는 모든 개별 값이 필요하지 않을 수 있습니다. 사후평균이나 중앙값과 같은 사후 통계량을 얻는 대신에, 연구자는 bayespredict, pmean이나 bayespredict, pmedian 명령어를 사용할 수 있습니다. 이 밖에 연구자는 시뮬레이션 값의 무작위 표본추출에 관심을 가질 수 있습니다. 이 경우 예를 들어, bayesreps, nreps(100) 명령어를 실행하면 100개의 반복표본을 생성할 수 있습니다.

 

끝으로, 연구자는 사후예측 p-value(PPPs, Bayesian predictive p-value)를 활용하여 모형의 적합도를 평가하고 싶어할 것입니다. PPPs는 관측자료와 반복 표본자료 사이의 일치도를 측정하는 지표로, 새롭게 추가된 명령어인 bayesstats ppvalues를 통해 계산할 수 있습니다. 이전의 예에서, 아래와 같이 입력하면 됩니다.

 

. bayesstats ppvalues {ymin} {ymax} using yminmax

alt

확장회귀모형(ERMs)은 지난 15버전에 추가된 기능 중 가장 주목할 만한 부분이었습니다. ERM명령어는 관측차료에서 발생할 수 있는 내생적 공변량, 표본선택, 처치효과와 같은 문제들을 설명하고 모델링합니다.

 

Stata16에서 새롭게 추가된 명령어는 패널자료를 위한 확장회귀모형인 xteregress, xteintreg, xteprobit, xteoprobit 입니다. 이는 확장회귀모형이 패널모형에서 앞서 언급한 세가지 문제들과 패널 내 상관을 이제부터 다룰 수 있다는 것을 의미합니다. 새로운 명령어는 확률효과 선형, 구간, 프로빗, 서열 프로빗 회귀모형을 추정할 수 있습니다. 그리고 하나 혹은 모든 방정식의 확률효과 간 상관구조를 반영할 수 있습니다.

 

관측자료(비실험자료)를 다루는 모든 분야의 연구자들은 확장회귀모형에 관심이 많으며, 패널자료에 적용할 수 있는 새로운 명령어에 흥분할 것입니다. 하지만 다른 분야에서는 이러한 모형을 다르게 부릅니다.

 

앞서, 확장회귀모형이 해결할 수 있는 내생적 공변량, 표본선택, 처치효과, 패널 내 상관을 언급하였습니다. 이러한 용어는 경제학과 같은 분야에서 공통된 용어이나 다른 분야에서는 다른 용어가 사용될 수 있습니다.

 

  • 패널 자료와 패널 내 상관 대신에, 연구자는 그룹내 상관을 다루는 다층자료(multilevel data) 모형은 동일한 모형입니다.

 

  • 내생적 공변량 대신에, 연구자는 관측되지 않은 교란효과 혹은 측정되지 않은 교란효과를 다루는 방법을 요청할 수 있습니다.

 

  • 표본선택 대신에, 연구자는 체계적 중도이탈(informative dropout), 무시할 수 없는 무응답, 비무작위적 결측에 대해 고민을 할 수 있습니다.

 

  • 처치효과 대신에, 연구자는 인과추론을 위한 방법이나 평균처치효과(ATEs)의 추정에 대해 요청할 수 있습니다.

 

중요하게 전달하고자 하는 것은 모든 학문에서 ERMs에 관심을 가지고 있으나 분야마다 다른 용어로 쓰인다는 점입니다.

alt

Stata 16에서 새로운 import sasimport spss 명령어가 추가되었습니다. 사용자는 이제 SAS(.sas7bdat)와 SPSS(.sav) 형식의 자료를 불러들일 수 있습니다. 대화상자를 사용하여 자료를 불러들이기 전, 자료에 대한 탐색을 쉽게 할 수 있으며, 필요한 경우 Stata로 불러들일 변수와 관측치를 부분적으로 선택할 수 있습니다.

 

(그림)

 

추가적으로 새로운 import sasxport8export sasxport8 명령어를 통해 사용자는 export SAS XPORT Version 8 Transport 파일을 Stata로 불러들이고 내보낼 수 있습니다. SAS XPORT Version 5 Transport 파일 지원을 위해 기존에 제공되었던 import sasxportexport sasxport 명령어는 import sasxport5export sasxport5로 명령어 이름이 변경되었습니다.

alt

Stata 16의 새로운 명령어인 npregress series는 비모수 계열 회귀분석으로 다항, B-스플라인 혹은 공변량의 스플라인을 이용하여 종속변수의 평균을 근사하는 방법입니다. 이는 사용자가 사전에 결정된 함수를 특정할 필요가 없다는 의미입니다. 사용자는 단순히 모형에 포함할 공변량을 정의하기만 하면 됩니다. 예를 들어 아래와 같이 입력하면,

 

. npregress series wineoutput rainfall temperature i.irrigation

 

계수결과가 출력되는 대신에, npregress series는 연속형변수의 평균외곽효과, 범주형변수의 대비 결과를 의미하는 계수를 리포트합니다. 예컨데, 강수량 평균외곽효과는 1이고 관개시설여부는 있는 경우와 없는 경우를 비교하면 2입니다. 이러한 비교는 관개시설상태의 평균적인 처치효과로 해석할 수 있습니다.

 

비모수 회귀분석에서, 추정평균은 공변량의 계열 함수로 적합된 값입니다. 그럼에도 margins 명령어를 활용하여 모수적 모형의 통계적 추론을 할 수 있습니다. 아래와 같이 입력하면,

 

. margins irrigation, at(temperature=(40(5)90))

 

기온이 40, 50,…, 90도(화씨)일 때 관개시설상태에 따른 기대효과 표를 얻고 marginsplot을 실행하면 그래프를 출력할 수 있습니다.


더 나아가, npregress series 명령어는 부분적 모수(준모수) 모형을 추정할 수 있습니다.

alt

사용자는 이제 메모리에 다수의 자료를 적재하고 관리할 수 있습니다. 예를 들어 아래와 같이 입력하면 people.dta를 메모리에 적재합니다.

 

. use people

 

다음으로 아래와 같이 입력하면, 두개의 자료가 메모리에 적재됩니다.

 

. frame create counties

. frame counties: use counties

 

people.dtadefault라는 이름의 프레임으로, counties.dtacounties라는 이름의 프레임으로 메모리에 저장됩니다. 현재 프레임은 default이고 Stata 대부분의 명령어는 현재 프레임의 자료를 사용합니다. 만약에 아래와 같이 입력하면,

 

. list

 

people.dta의 자료 내용이 출력됩니다. 만약 아래와 같이 입력하면,

 

. frame counties: list

 

counties.dta 자료 내용이 출력됩니다. 혹은 현재 프레임을 counties로 변경하기 위해 아래와 같이 입력하고 list를 수행하면 counties 자료 내용이 출력됩니다.

 

. frame change counties

 

프레임의 관리와 탐색은 매우 쉬우며 서로 연관관계를 가집니다. 두개 자료에 국가를 구분하는 countycode가 있다고 가정해 봅시다. 아래와 같이 입력하면,

 

. frlink m:1 countycode, frame(counties)

 

default 프레임에 각 사람들은 counties 프레임의 국가와 연결됩니다. 이는 사용자가 frget 명령어를 통해 counties 프레임으로부터 현재프레임에 변수를 복사할 수 있다는 것을 의미합니다. 혹은 frval() 함수를 이용하여 counties 프레임의 변수값에 직접 접근할 수 있습니다. 예를 들어 default 프레임에 개인소득변수가 있고, counties 프레임에는 국가별 개인소득 중앙값이 있다고 가정하면, 사용자가 상대소득값을 저장하는 새로운 변수를 아래와 같이 입력하여 생성 할 수 있습니다.

 

. generate rel_income = income / frval(counties, median_income)

 

언급된 내용은 단순한 예에 불과합니다. 예제에서는 단지 두개의 프레임만 다루고 있지만, 메모리에 한번에 최대 100개 프레임을 담을 수 있고 사용자는 프레임들 사이의 수많은 연결을 설정할 수 있습니다.

alt

새로운 ciwidth 명령어는 신뢰구간 추정을 위한 정밀도와 표본크기(PrSS) 분석을 수행합니다. 이 방법은 연구계획 단계에서 사용되며, 추론 방법으로 신뢰구간을 활용할 때 연구자가 최적의 자원을 할당하기 위해 사용됩니다. 다르게 이야기하면, 연구자가 계획된 연구에서 요구되는 신뢰구간의 정밀도를 얻기 위해 필요로 하는 표본크기를 추정하고자 할 때 활용됩니다.

 

ciwidth는 표본크기, 정밀도를 계산하고 아래 언급된 내용을 산출하기 위하 더 많은 정보를 제공합니다.

 

  • 단일 평균의 신뢰구간
  • 단일 분산의 신뢰구간
  • 두개의 독립 평균의 신뢰구간
  • 두개의 짝진 평균의 신뢰구간

 

ciwidth 대화상자는 사용자가 분석유형을 선택하고 요구되는 결과를 얻기 위한 가정을 입력할 수 있습니다.

 

ciwidth는 결과를 사용자정의 표와 그래프로 출력할 수 있습니다.

 

ciwidth는 또한 사용자 정의 방법을 추가하는 편의성을 제공합니다.

alt

Stata15에서, 경제학과 금융분야에서 사용되는 시계열 모형인 선형 DSGE 모형을 추정하는 dsge 명령어가 처음 소개되었습니다. 이러한 모형은 전통적 예측모형의 대안적 모형입니다. DSGE 모형은 집합적인 경제적 현상을 미시경제학 이론으로부터 도출된 모형에 근거하여 설명합니다.

 

Stata 16에서는 새롭게 비선형 DSGE 모형을 추정할 수 있는 dsgenl 명령어가 추가되었습니다. 대부분의 DSGE 모형은 비선형이므로, 이제는 더 이상 사용자가 직접 선형화를 하는 과정이 필요없게 되었습니다. 사용자가 dsgenl 명령어에 회귀식을 입력하는 것만으로도 선형화 과정을 수행합니다.

 

dsgenl 명령어를 통해 모형의 모수를 추정한 이후에, 사용자는 전이 매트릭스와 정책 매트릭스를 산출합니다. 모형의 정상상태를 결정하고 연립방정식에 내재된 변수의 분산, 공분산, 자기공분산을 추정합니다. 그리고 충격반응 함수 그래프를 출력합니다.

 

이는 거시경제학자와 중앙은행에서 근무하는 사람들에게 매우 선호되는 방법입니다.

alt

IRT 모형은 잠재(관측되지 않은) 특성과 특성의 양상이 측정된 문항사이의 관계를 탐색합니다. 이는 수학적 능력과 같은 능력과 관련한 관심특성을 표준화된 검사에서 측정할 경우, 자주 활용됩니다. 문항(검사질문)들은 관측되지 않은 특성을 측정하기 위해 설계됩니다. 교육, 심리, 보건 분야의 연구자들은 IRT 모형을 자주 활용합니다.

 

Statairt 명령어는 1-,2-,3-모수 로지스틱 모형을 추정합니다. 모형은 등급반응변수나 명목반응변수, 부분점수, 평정척도 모형과 그것이 조합된 모형을 추정할 수 있습니다. 그리고 모형을 추정한 이후에, irtgraph는 문항특성곡선, 검사특성곡선, 문항정보함수, 검사정보함수 그래프를 출력합니다.

 

Stata 16의 irt 명령어에 새롭게 추가된 기능은 다중집단 분석입니다. irt 명령어에 group(varname) 추가하는 것으로 다중집단 분석을 수행할 수 있습니다. 예를 들어 아래와 같이 입력하면, 2집단 2-모수 모형을 추정합니다.

 

. irt 2pl item1-item10, group(female)

 

잠재특성의 평균과 분산이 그룹별로 추정될 것입니다. 그룹별 난이도와 변별도 모수가 한 개 혹은 다수의 문항에 대해 또한 추정될 것입니다. 제약조건을 이용하면, 연구자가 어떤 모수는 그룹간 변동하게 그리고 어떤 모수는 그룹 간 동일하게 추정되도록 정의할 수 있습니다.

 

사용자는 IRT 모형에서 제약조건이 설정된 모형과 그렇지 않은 모형 간의 우도비검정을 통해 차별기능문항에 대한 검정을 실시할 수 있습니다.