mysqldump은(는) 내부 또는 외부 명령, 실행할 수 있는 프로그램, 또는 배치 파일이 아닙니다. db 설치 경로에 들어가서 mysqldump 입력 - 내 db설치 경로: c:\Program Files\MySQL\MySQL Server 8.0\bin - 따라서 cmd창에서 cd c:\Program Files\MySQL\MySQL Server 8.0\bin 입력해서 이동 함. 그 후 mysqldump -uroot -p0000 new_schema addr_tp_2 > backup.sql 컬럼명가져오기 SELECT `COLUMN_NAME` FROM `INFORMATION_SCHEMA`.`COLUMNS` WHERE `TABLE_SCHEMA`= 'yourdatabasename' AND `TABLE_NAME`..
진료년월, 성분코드 입력 시 전국 데이터 가져오는 코드 1. ${일반 인증키(Decoding)} 부분에 본인의 일반 인증키(Decoding) 입력. service_key = "${일반 인증키(Decoding)}" 2. 진료년월(digay_ym)은 2022년 1월, 성분코드(gnl_nm_cd)는 488501ATB sido_sggu_lists에 있는 다섯개의 지역에 대해서만 for문을 돌며 데이터를 가져올 예정. diag_ym = '202201' # 진료년월 gnl_nm_cd = '488501ATB' # 성분코드 # [시도코드, 시군구코드] 쌍으로 되어 있는 리스트. sido_sggu_lists = [['220000','220003'], ['320000', '320100'], ['110000', '11001..
1. 공공데이터포털에서 오픈 API를 이용해 XML형식의 데이터를 받음. 2. 받은 xml파일을 pd.read_xml을 사용해 dataframe으로 바꿈. 1. 공공 데이터 포털 접속 사이트 주소: https://www.data.go.kr/index.do 공공데이터 포털 국가에서 보유하고 있는 다양한 데이터를『공공데이터의 제공 및 이용 활성화에 관한 법률(제11956호)』에 따라 개방하여 국민들이 보다 쉽고 용이하게 공유•활용할 수 있도록 공공데이터(Datase www.data.go.kr 2. 원하는 공공데이터 검색 3. 오픈 API 탭 선택 4. 활용 신청 원하는 오픈 API에 들어가 '활용 신청' 버튼 클릭 이 글에서는 건강보험심사평가원_요양기관개폐업정보조회서비스를 기준으로 함. (링크: https:..
https://wikidocs.net/184983 07-04 자연어 처리를 위한 1D CNN(1D Convolutional Neural Networks) 합성곱 신경망을 자연어 처리에서 사용하기 위한 1D CNN을 이해해보겠습니다. ## 1. 2D 합성곱(2D Convolutions) 앞서 합성곱 신경망을 설명하며 합성곱 연산… wikidocs.net PyTorch로 시작하는 딥 러닝 입문이라는 위키독스에 있는 자연어 처리를 위한 1D CNN 연습문제를 풀어보겠습니다. (Pytorch conv1D 예제) 먼저 필요한 라이브러리를 임포트합니다. import torch import torch.nn.init device = 'cuda' if torch.cuda.is_available() else 'cpu' 신..
https://wikidocs.net/61073 06-08 다층 퍼셉트론으로 MNIST 분류하기 앞서 소프트맥스 회귀로 MNIST 데이터를 분류하는 실습을 해봤습니다. 소프트맥스 회귀 또한 인공 신경망이라고 볼 수 있는데, 입력층과 출력층만 존재하므로 소프트맥스 함수를 활성… wikidocs.net 실습 코드 에러나는 부분 수정한 버전 (23.1.15 ver) # 1. 데이터 로드하기 import numpy as np import matplotlib.pyplot as plt from sklearn.datasets import fetch_openml mnist = fetch_openml('mnist_784', version=1, cache=True) print(mnist.data.iloc[0]) # 코드 ..
!pip install plotly html로 저장할 때 import plotly.express as px fig =px.scatter(x=range(10), y=range(10)) fig.write_html("file.html") sample data import pandas as pd d = {'month': [1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3], 'label': ['a', 'a', 'a', 'b', 'b', 'b', 'a', 'a', 'a', 'b', 'b', 'b'], 'value': [100, 105, 200, 205, 300, 100, 200, 105, 400, 705, 900, 1000], 'code': ['abc', 'abc', 'abc', 'abc', 'abc..
목적: python을 이용해 특정 구분자로 구분 되어 있는 문자열에서 제일 마지막 값만 없애기. import pandas as pd df = pd.DataFrame({'cat':['건>강', '디>지>털', '화>장>품']}) # df['cat'] = df['cat'].apply(lambda x: ">".join(x.split(">")[:-1])) Before After 참고로 샘플 데이터를 저렇게 만들어서 그렇지 실제로는 '건강>건강관리>마스크', '디지털>휴대폰액세서리>휴대폰케이스>기타케이스', '화장품>스킨케어>크림' 이런식으로 되어 있는 데이터였음. 본인의 데이터가 샘플 데이터처럼 생겼고, 저 상황에서 맨 마지막 두 글자만 떼고 싶으면 '화>장>품'[:-2] 이렇게 하면 됨. Data Frame에..
가장 먼저 시각화에 필요한 라이브러리를 불러옴. # matplot import matplotlib as mpl import matplotlib.pyplot as plt # seaborn import seaborn as sns # numpy와 pandas import numpy as np import pandas as pd matplot 버전확인 방법 print(mpl.__version__) 가장 기본적인 사용법 (plt.plot()) # sample data data_dict = {'x':[1, 2, 3, 4, 5], 'y':[6, 7, 8, 9, 10], 'y2':[1, 3, 5, 7, 9]} plt.plot(data_dict['y']) # y값 plt.plot(data_dict['x'], data_d..
Information Value 설명: Variance Threshold 설명: 저 분산(low-variance) 피쳐 제거. training set의 분산 확인. 분산이 0이면 모든 샘플에서 동일한 값을 갖고 있다는 뜻. Threshold를 .8 * (1 - .8))이라고 하면 80% 넘게 동일한 값을 가지고 있는 컬럼이 제거 됨. chi2 설명: f_regression 설명: F-statistic 과 p-value를 반환하는 일변량 선형회귀 테스트. 여러 회귀 변수에 대해 순차적으로 단일 회귀 변수의 효과를 테스트하는 빠른 선형 모델. Step1: 회귀 변수와 타겟 변수의 cross 상관관계는 r-regression을 이용해 계산 됨. r-regression: 각 피쳐와 타겟에 대한 피어슨 r(피어슨..
- Total
- Today
- Yesterday