분류 전체보기 326

[데이터분석공부 5일차] 모평균에 대한 추론(가설 검정)

모평균에 관한 추론 점추정 : 모집단의 확률분포가 정확하게 알려진 경우, 표본평균을 이용해 모평균을 추정 구간추정 : 모집단의 특성에 따른 표본평균의 분포를 이용하여 신뢰구간을 추정 신뢰구간 추정 모평균의 100(1-α)%의 신뢰구간 모집단이 분산이 알려진 정규분포를 따를 경우-표본분포를 이용 $$\bar{X} - z_{\frac{a}{2}}\cdot\frac{\sigma}{\sqrt{n}},\enspace \bar{X} + z_{\frac{a}{2}}\cdot\frac{\sigma}{\sqrt{n}} $$ 모집단의 분산이 알려졌으나 정규분포를 따르지 않을 경우(n이 충분히 클 때) - 중심극한정리를 이용 $$\bar{X} - z_{\frac{a}{2}}\cdot\frac{\sigma}{\sqrt{n}}..

[데이터분석 공부 4일차] 통계적 추론

추정(estimation) 전수조사가 불가능하거나 비실용적인 경우에 실행 대상 모집단으로부터 표본을 추출하고 이러한 표본을 근거로 확률론을 활용하여 모집단의 모수들에 대해 통계적으로 추론하는 것 점추정 표본 정보로부터 모집단의 모수를 하나의 값으로 추정하는 것 (표본 평균, 표본 분산 등) 모수 추정량 모 평균 $$\mu$$ 표본 평균 $$\bar{X}$$ 모 분산 $$\sigma^2$$ 표본 분산 $$S^2$$ 묘 표준편차 $$\sigma$$ 표본 표준편차 $$S$$ 모 비율 $$p$$ 표본 비율 $$\hat{p}$$ 구간 추정 모수의 참값이 포함되어 있다고 추정되는 구간을 결정하는 것 (신뢰구간) 모 평균에 대한 신뢰구간 : 표본 평균의 분포를 이용해 추정 $$(\bar{X}-z_{\frac{a}{2..

[데이터분석 공부 3일차] 확률과 확률분포

확률이란? 경험 혹은 실험의 결과로 특정한 사건이나 결과가 발생할 가능성 표본 공간(S)에서의 임의 사건(E)에 대해서 사건이 발생할 확률(P)은 아래의 세 조건을 만족해야 함 $$ 0 \leq P(E) \leq 1 $$ $$ P(S) = 1 $$ $$ E_1, E_2, \dots $$ 이 서로 배반사건일 때 $$P(\bigcup_{i=1}^{\infty}E_i) = \sum_{i=1}^{\infty}P(E_i) $$ 표본공간(sample space) : 통계적 실험에서 모든 가능한 결과의 집합 사건(event) : 관심이 있는 실험 결과의 집합(표본 공간의 부분 집합) 근원사건 : 한 개의 원소로 된 사건 사건의 연산 합사건 : $$ A \cup B $$ 곱사건 : $$ A \cap B $$ 여사건 :..

종목부터 살펴보는 시황 190702

안녕하십니까 밥입니다. 요즘 장이 심심치 않아 보여서 시황 한 번 올려보겠습니다. 일단 저는 거래량 상위 종목에서 시장상황을 알 수 있다고 생각합니다. 새로운 거래량, 거래대금 상위 종목이 나타난다면 시장이 끊임없이 다른 종목들에 관심을 가진다는 뜻이기 때문에 좋은 상황일 것이고 이전에 거래량, 거래대금 상위 종목에 나타난 종목만 꾸준히 관심을 받는다면 시장이 고여있다는 뜻이 되겠지요. 시장이 고여있다면? 결국 썩을 것이고 시장에겐 악영향을 미칠 것입니다. 그럼 거래량 상위 종목들을 살펴봅시다. 이중에 이전에 거래량이 터지지 않은 종목들은 (며칠 내에 최초로 거래량이 터진 종목들)은 다날, 동진쎄미켐, 대창솔루션, 대성엘텍 정도라고 볼 수 있겠습니다. 음.. 15종목 중에 다섯 종목이면 그리 적은 편은 ..

[데이터분석 공부 2일차] 자료 시각화(히스토그램, 상자그림, 산점도 분석)

기술통계 (Descriptive Statistics) 자료를 요약하는 기초적 통계 데이터 분석에 앞서 데이터에 대한 이해와 통찰을 얻기 위한 과정 빈도, 평균, 표준편차, 중앙값, 최소값, 최대값, 범위, 왜도, 첨도, 오차 등 자료의 시각화(Visualization) 자료의 특징이나 분포를 한눈에 보기 쉽도록 시각화 히스토그램(Histogram) 빈도수를 표현하는 막대 그래프 사각형의 높이는 구간의 밀도와 동일하다 히스토그램의 전체 영역은 데이터의 개수와 동일하다 상자그림(Box plot) 데이터의 분포 형태 확인 및 분석에 주요한 변수 도출을 위해 사용하는 방법 자료의 크기 순서를 나타내는 순서 통계량을 이용하여 자료를 요약 정리하는 방법 (순서통계량 : 최소값, 제1사분위수, 중앙값, 제3사분위수,..

[데이터 분석 공부 1일차] 모집단과 표본추출법

데이터의 수집 1930년 이후부터 발전 시작 1단계 : 연필, 노트, 수동적 수집 2단계 : 휴대폰같이 손으로 들고 다닐 수 있는 컴퓨터를 이용해 자동 수집 3단계 : 데이터 자동, 실시간 갱신 및 수집 (자동화) -> 오늘날 "데이터의 시대". 1937년 데이터 분석 사례 : 'Mass Observation' 수염, 눈썹, 제스처 등 일상 모습에 관한 데이터를 수집하여 국가의 문화를 이해하는데 활용 https://en.wikipedia.org/wiki/Mass-Observation 데이터화, Datafication 삶의 모든 측면을 포착해 그것을 데이터로 바꾸는 과정 대상을 데이터화하여 다양하게 활용 및 새로운 가치로 변환할 수 있다. 데이터분석 데이터를 통계 및 계량적 측면에서 분석하고, 분석 결과로..

스맥-로봇과 함께

안녕하십니까 밥입니다. 오늘 소개시켜드릴 종목은 스맥입니다. 기업개요부터 보시죠 동사는 정보통신장비의 개발, 제조 및 관련 소프트웨어의 개발, 판매 등을 주 목적 사업으로 1996년 3월 설립되었으며 2009년 5월 코스닥시장에 상장됨. 또한 2011년 2월 1일 합병으로 인하여 통신사업외에 기계사업(공작기계 제조 및 판매, 산업용 로봇의 제조 및 판매업)을 추가로 영위하게 되었음. 공작기계(중소형 CNC선반, 머시닝센터 등) 및 관련 부품, LCD 생산관련 Robot의 제조 및 판매 등이 주요 사업임. 다른 건 별거 없고 통신사업 외 기계사업을 한다고 하는데 이 두가지 특징을 살리는지 로봇제조 및 판매가 주요 사업으로 들어가 있습니다. 사실 주요 사업이 아니라도 상관 없습니다. 가능성이 있는 게 중요하..

VirtualBox로 리눅스 서버 만들기 1 : 가상머신 생성 및 우분투 리눅스 설치

virusalbox는 현재 오라클에서 운영중인 프로그램으로 가상으로 서버를 구축할 수 있게 해줍니다. 비상업적, 개인적 용도로는 무료이며, 확장팩을 이용할 경우 라이센스를 구매해야 합니다. 1) VirtsulBox 설치파일 다운받아 실행하기 다운로드 링크 : https://www.virtualbox.org/wiki/Downloads Oracle VM VirtualBox Welcome to VirtualBox.org! News Flash New May 14th, 2019VirtualBox 6.0.8 released! Oracle today released a 6.0 maintenance release which improves stability and fixes regressions. See the Cha..

[SQL] UPDATE (데이터 수정 or 변경) / INSERT (데이터 삽입)

UPDATE 데이터를 수정 및 변경해야 하는 경우 UPDATE 구문을 사용한다. UPDATE 테이블명 SET 수정할 데이터가 있는 컬럼명 = 수정할 내용 WHERE 조건이 적용될 컬럼명 = 조건 ※WHERE 조건을 쓰지 않으면 해당 칼럼 전체의 내용이 수정되니, 주의해야 한다. 예시) UPDATE 학생_주소 SET 시군구 = '성남시 분당' WHERE 학생ID = '2018_1542' INSERT 데이터를 1행씩을 삽입해야 하는 경우 INSERT 구문을 사용한다. INSERT INTO 테이블명 (컬럼1, 컬럼2, 컬럼3) VALUES (데이터1, 데이터2, 데이터3) 데이터가 들어갈 컬럼과, 해당 데이터의 값의 순서를 동일하게 나열해야 한다. 예시) INSERT INTO 학생_주소(학생ID, 시도, 시군..

[엑셀] 클립보드 지우기 (엑셀이 자꾸 꺼질 때, 응답없음 문제 해결)

엑셀로 작업을 하다보면,,, 메모리 부족이라던지 갑자기 응답없음이 떠서 작업에 애먹을 때가 종종있죠. 그럴 땐 클립보드에 혹시 너무 많은 데이터가 저장되어 있는지를 확인해보는 방법이 있습니다. 1. 홈 탭의 클립보드에서 클립보다 대화 상자 표시 아이콘을 클릭합니다. 2. 스프레드시트 왼쪽에 클립보드 작업창이 나타나고, 현재 임시로 저장되있는 클립보드가 모두 나타납니다. 3. 클립보드를 모두 지우려면 '모두 지우기' 단추를 클릭해주세요. 4. 하나씩 지우러면 해당 클립에 마우스를 갖다 댄 후, 마우스 오른쪽 버튼을 클릭해, '삭제' 합니다. ※클립보드가 너무 많이 쌓이면,, 메모리를 많이 소모해 엑셀이 갑자기 다운될 수 있으니 작업 중 주기적으로 지워주는 것을 추천드립니다!

반응형