본문 바로가기

분석77

[해결팁] 맥, OSX에서 R로 wordCloud시 한글 깨짐 R로 wordcloud 생성 시에 아래와 같이 한글이 깨지는 경우, wordcloud(words = df_word$word, freq = df_word$freq, min.freq = 2, max.words = 200, random.order = F, rot.per = .1, scale = c(4, 0.3), colors = pal, family="AppleGothic") 와 같이 family = "AppleGothic" 부분을 추가해주면, 이렇게 한글이 예쁘게. 2018. 8. 30.
R에서 MySQL 접속하기 R에서 MySQL에 접속하기 위해서는 첫째, 아래의 두 가지의 패키지를 우선 설치하여야 한다. - DBI - RMySQL 방법은 R Console에서 아래와 같이 실행하여 설치할 수 있다. - Install.packages("DBI") - Install.packages("RMySQL") 둘째, 설치한 패키지를 Library 로 로딩한다. - Library(DBI) - Library(RMySQL) 셋째, 접속하고, 쿼리저장 및 실행 - 접속 : con 2018. 8. 6.
[SQL] 중복제거 쿼리 'table1' 이라는 이름의 다음과 같은 테이블이 있다고 하면, +----+--------+ | id | name | +----+--------+ | 1 | google | | 2 | yahoo | | 3 | msn | | 4 | google | | 5 | google | | 6 | yahoo | +----+--------+ 아래와 같은 쿼리로 중복된 행 중에서 한 행만 남기고 지울 수 있다. DELETE n1 FROM table1 n1, table1 n2 WHERE n1.id > n2.id AND n1.name = n2.name 2018. 2. 19.
Nelson rules Nelson Rules Nelson rules are a method in process control of determining if some measured variable is out of control (unpredictable versus consistent). Rules, for detecting "out-of-control" or non-random conditions were first postulated by Walter A. Shewhart [1] in the 1920s. The Nelson rules were first published in the October 1984 issue of the Journal of Quality Technology in an article by Llo.. 2016. 7. 18.
계수형 관리도의 정의 계수형 관리도의 정의 Minitab에는 결점(불일치성) 또는 불량품(불일치 단위)을 표시하는 몇 가지 계수형 관리도가 있습니다. 결점은 품질 특성을 가리키며 불량품은 제품 전체를 가리킵니다. 한 단위에 품질 특성이 여러 개 있을 수 있지만 단위 자체는 불량품이거나 불량품이 아닐 뿐입니다. 예를 들어, 금속 판의 긁힌 자국은 결점입니다. 긁힌 자국이 여러 개일 경우, 판 전체가 불량품으로 간주될 수 있습니다. 이항 분포 또는 포아송 분포 중 데이터가 따르는 분포에 따라 계수형 관리도를 선택하십시오. 이항 데이터용 계수형 관리도 이항 데이터 값은 통과/실패 또는 합격/불합격 등의 두 개 범주 중 하나로 분류됩니다. 이항 데이터는 불량 표본 부품의 백분율 같은 비율이나 백분율을 계산하는 데 자주 사용됩니다. .. 2016. 7. 18.
[SQL Server] MSSQL에서 행마다 다른 Random number 발생하기 MSSQL 에서 랜덤넘버를 발생하는 코드는 간단하다. Select rand() 하지만, 위의 코드로 여러 행에 걸쳐서 랜덤한 숫자를 발생시키려 하면 각 행마다 같은 랜덤넘버가 적용되어버린다. 이럴때는이렇게 처리하면 된다. select rand(convert(varbinary, newid())) 2016. 5. 26.
평균 그리고 표준편차의 개념 평균이라는 말은 주변에서 많이 쓰이기도 하며 보통 잘 알고 있는 수치입니다. 그런데 평균이라는 수치는 오해를 유발할 수 있는 약간 모자란 수치입니다. 예를 들어서 두 학급의 시험 성적을 예로 들어볼까요? "1반과 2반의 중간고사 평균 점수가 똑같이 50점이 나왔다"고 생각을 해보면 두 반이 성적이 같네 라고 생각을 하게됩니다. 음~ 틀린말은 아니지만 맞는 말도 아니거든요. 아래의 그래프롤 한번 볼까요? 두 반 모두 평균은 50점 이지만, 1반(Group A)은 50점을 기준으로 많이 퍼져 있습니다. 고득점과 저득점으로 흩어져 있죠. 반면에 2반(Group B)은 거의 모든 학생들이 70점과 30점 사이에 몰려 있습니다. 이러한 형태에서 1반(Group A)을 보고 "흩어짐(표준편차)가 크네 " 라고 표현.. 2016. 1. 7.