1. repository로컬 저장소는 아래 3가지로 이루어짐- working directory : 실제소스코드- Index : stage 역할을함- head : commit 을 한 소스코드 2. clonegit clone : 로컬 / 원격 repository 를 복사한다. 3. commitgit add git commit : 변경 내용이 head 에 반영됨로컬 저장소에는 변경이 반영되었지만 원격 저장소에는 아직 반영되지 않음 4. checkout브랜치를 변경 git checkout -b feature_xgit checkout master //master 로 돌아옴 푸쉬하고 난 다음에 문제가 발견되었을 시 이전버전으로 돌아갈 수도 있다.git checkout -- //이전버전으로git checkout //..
0. MavenMaven 은 Java 용 프로젝트 관리 툴으로 복잡한 Java Project 에서 dependency 나 library 들을 일일히 설치할 필요 없이 필요한 구조를 미리 정의해두어 개발자가 한번에 build 를 할 수 있도록 도와준다. 아래는 Maven 의 목적Making the build process easyProviding a uniform build systemProviding quality project informationProviding guidelines for best practices developmentAllowing transparent migration to new features 1. pom.xmlProject Object Model. dependency 가 필요..
1. Java 기본형 데이터 타입 Java data type 에는 기본형 (Primative) 와 참조형 (Reference) 이 있다. 기본형은 boolean, char, byte, short, int, long, float, double와 같이 계산을 할 수 있는 타입이며,참조형은 기본형을 제외한 나머지 타입으로 java.lang.Object 를 상속받는다.String, Array,Class 등이 참조형 데이터타입이다. Java에서 기본형데이터 타입은 반드시 사용하기 전에 declare 되어야한다. 2. ClassLoader 와 GC(garbage collection) ClassLoader클래스 로더는 Java의 클래스파일을 로드하는데 사용된다.Java로 쓰여진 코드는 javac 컴파일러 를 사용하여..
Question : "gmail" 메일을 입력한 유저만 필터링 하기 URL정규식을 사용하여 필터링 하고, Matcher 와 find 메소드를 사용하여 처리. Regular Expressions (RegEx) Predefined: \ followed by a letter. For example, \d for matching digits (0-9) or \D for matching non-digits. There are also additional predefined character classes that are followed by a set of curly braces, such as \p{Punct} which matches punctuation (i.e.: !"#$%&'()*+,-./:;?@[]^_..
Logistic Regression독립변수의의 선형 결합을 이용하여 사건의 발생 가능성을 예측할 때 사용되는 통계기법 로지스틱 회귀의 목적은 종속변수와 독립변수간의 관계를 구체적인 함수로 나타내어 향후 예측 모델에 사용하는 것이다. 독립변수의 선형 결합을 이용하여 사건의 발생가능성을 예측하는 통계적 기법을 활용한것(일어날 확률/일어나지 않을 확률) 결과적으로 로지스틱 회귀의 y값은 0~1 사이의 확률값이 된다. 종속변수가 범주형 데이터를 대상으로 하며 입력 데이터가 주어졌을 때 해당 데이터의 결과가 특정 분류로 나뉘기 때문에 일종의 classification 기법으로 볼 수 있다. logistic regression 은 데이터가 두 집단(0또는 1)로 나뉘어져 있는 경우에 사용된다. Python Logi..
T-Test 란 T-Test (Two-Sample Test / Student's T Test) 란 두 집단의 평균을 비교하는 통계적 검정 방법이다단순히 차이의 존재 여부를 떠나 두 집단의 비교가 통계적으로 유의미한가 를 검정한다. 다른말로는, 이 두 모집단의 차이가 우연에 의해서인지 아닌지를 검정한다. Example 1 ) 감기에 걸렸을때 약을 먹었을때 치유되는 기간과 먹지 않았을때 자연적으로 치유되는 기간을 비교할 수 있다. 두가지 case 의 차이가 유의미한지 검정하기 위해서는 여러명의 사람에게 평균적으로 비슷한 기간이 걸리는지 테스트를 할 필요가 있다. (약을 먹었을때 평균 3일, 자연치유가 평균 5일이 걸렸을 시 이 결과가 repeatable 한가? 우연에 의해서 혹은 다른 요인에 의해 차이가 나..
문제A Node class is provided for you in the editor. A Node object has an integer data field, , and a Node instance pointer, , pointing to another node (i.e.: the next node in a list).A removeDuplicates function is declared in your editor, which takes a pointer to the node of a linked list as a parameter. Complete removeDuplicates so that it deletes any duplicate nodes from the list and returns the..
one-hot-encoding몇 가지로 분류할 수 있는 데이터를 범주형 변수라고 한다. one hot encoding 범주를 column 으로 만들고, 각각해당하는 칸의 정보를 1로 표시하고 나머지를 0으로 표시하는 방법이다. 소스코드 df_one_hot_encoded = pd.get_dummies(titanic.embarked)titanic = pd.concat([titanic, df_one_hot_encoded], axis=1) 결과물get_dummies 로 one hot encoding 을 만들어줌 Titanic 에 추가 pandas - get_dummies Convert categorical variable into dummy/indicator variables pandas - concatconc..
value_counts어떤 값들이 있는지 대략적으로 보기. 종류와 개수를 새어준다. stud_alcoh1['Pstatus'].value_counts() s.str.contains(' string ')series 데이터에 .str 을 붙여 text data 를 변형할 수 있다. stud_alcoh1.famsize.str.contains('G') isin포함 한다면 True, 포함하지 않는다면 False mother_job = stud_alcoh1.loc[stud_alcoh1.Mjob.isin(['at_home', 'services']), ['Mjob','Fjob', 'reason']] df.aggnumpy.ptp 편차 구하기 chipo.groupby('order_id')['item_price'].agg(n..