본문 바로가기
반응형

분류 전체보기154

신규 아이디 추천 [프로그래머스] 문제 풀이 정리 문제 설명 카카오에 입사한 신입 개발자 네오는 "카카오계정개발팀"에 배치되어, 카카오 서비스에 가입하는 유저들의 아이디를 생성하는 업무를 담당하게 되었습니다. "네오"에게 주어진 첫 업무는 새로 가입하는 유저들이 카카오 아이디 규칙에 맞지 않는 아이디를 입력했을 때, 입력된 아이디와 유사하면서 규칙에 맞는 아이디를 추천해주는 프로그램을 개발하는 것입니다. 다음은 카카오 아이디의 규칙입니다. 아이디의 길이는 3자 이상 15자 이하여야 합니다. 아이디는 알파벳 소문자, 숫자, 빼기(-), 밑줄(_), 마침표(.) 문자만 사용할 수 있습니다. 단, 마침표(.)는 처음과 끝에 사용할 수 없으며 또한 연속으로 사용할 수 없습니다. "네오"는 다음과 같이 7단계의 순차적인 처리 과정을 통해 신규 유.. 2021. 4. 25.
음양 더하기 [프로그래머스] 문제 풀이 정리 문제 설명 어떤 정수들이 있습니다. 이 정수들의 절댓값을 차례대로 담은 정수 배열 absolutes와 이 정수들의 부호를 차례대로 담은 불리언 배열 signs가 매개변수로 주어집니다. 실제 정수들의 합을 구하여 return 하도록 solution 함수를 완성해주세요. 제한사항 absolutes의 길이는 1 이상 1,000 이하입니다. absolutes의 모든 수는 각각 1 이상 1,000 이하입니다. signs의 길이는 absolutes의 길이와 같습니다. signs[i] 가 참이면 absolutes[i] 의 실제 정수가 양수임을, 그렇지 않으면 음수임을 의미합니다. 입출력 예 absolutes / signs / result [4,7,12] [true,false,true] 9 [1,2,3.. 2021. 4. 25.
모의고사 [프로그래머스] 모의고사. LEVEL 1. 완전탐색. 문제 풀이 정리 문제 설명 수포자는 수학을 포기한 사람의 준말입니다. 수포자 삼인방은 모의고사에 수학 문제를 전부 찍으려 합니다. 수포자는 1번 문제부터 마지막 문제까지 다음과 같이 찍습니다. 1번 수포자가 찍는 방식: 1, 2, 3, 4, 5, 1, 2, 3, 4, 5, ... 2번 수포자가 찍는 방식: 2, 1, 2, 3, 2, 4, 2, 5, 2, 1, 2, 3, 2, 4, 2, 5, ... 3번 수포자가 찍는 방식: 3, 3, 1, 1, 2, 2, 4, 4, 5, 5, 3, 3, 1, 1, 2, 2, 4, 4, 5, 5, ... 1번 문제부터 마지막 문제까지의 정답이 순서대로 들은 배열 answers가 주어졌을 때, 가장 많은 문제를 맞힌 사람이 누구인지 배열.. 2021. 4. 24.
문장 생성 해보기 with. mini-GPT (feat. 네이버 기사 댓글) 저번 문장 생성의 경우 RNN의 하나인 GRU를 이용해 문장을 생성해보았다. 문장 생성 해보기 (feat. 네이버 기사 댓글) 문장 생성 해보기 (feat. 네이버 기사 댓글) 이전 글을 통해 가져온 데이터를 이용해보자 가져온 데이터를 이용해 문장을 생성할 것이다. 1. 네이버 영화평 가져오기 네이버 영화평 가져오기 네이버 영화평 가져오기 설명 들어가기 전 네이 hoonzi-text.tistory.com 이번엔 언어 모델계 강력한 모델인 GPT...는 아니고, GPT구조를 간략하게 만든 mini-gpt를 이용해 문장을 생성해보려고 한다. GPT를 이해하기 위해서는 이해해야 하는 선행 개념들이 있다. 여러 블로그와 글들을 참고해서 나름의 정리를 하는데 틀릴수 있으니 걸러서 보면된다. attention이 뭔.. 2021. 4. 21.
java excel 처리 정리 매번 엑셀을 java로 읽을때마다 찾아보는게 귀찮아서 정리한다. 사용 모듈 apache poi jar 리스트 - poi-3.11.jar - poi-ooxml-3.11.jar - poi-ooxml-schemas-3.11.jar - xmlbeans-2.6.0.jar 1. 엑셀 파일 열기 & 닫기 String excel_filePath = "test.xlsx"; // 엑셀 파일 경로 지정 FileOutputStream fos = new FileOutputStream(excel_filePath); // FileOutputStream 으로 불러오기 XSSFWorkbook workbook = new XSSFWorkbook(); // 엑셀 쓰기전 workbook 지정 // do excel something workb.. 2021. 4. 16.
문장 생성 해보기 (feat. 네이버 기사 댓글) 이전 글을 통해 가져온 데이터를 이용해보자 가져온 데이터를 이용해 문장을 생성할 것이다. 1. 네이버 영화평 가져오기 네이버 영화평 가져오기 네이버 영화평 가져오기 설명 들어가기 전 네이버의 robots.txt 에 대해 먼저 숙지하자. 사용 언어 및 모듈 - python 3.7 - request = request 요청을 보내 html 값을 가져오기 .. hoonzi-text.tistory.com 2. 네이버 기사 댓글 가져오기 네이버 기사 댓글 가져오기 네이버 기사 댓글 가져오기 들어가기 전 네이버의 robots.txt 에 대해 먼저 숙지하자. 사용 언어 및 모듈 - python 3.7 - request = request 요청을 보내 html 값을 가져오기 .. hoonzi-text.tistory.com.. 2021. 4. 2.
DOM Based Content Extraction via Text Density 구현해보기 결론부터 말하자면 반쪽짜리 구현이다. 참고하고 더 읽을지 말지 결정하기 바란다. 사용모듈 - python 3.7 - requests = 뉴스기사 가져오기 위함 - BeautifulSoup = html 파싱을 위함 이전 두개의 글( 네이버 영화평, 네이버 댓글 수집) 에서 나는 크롤링이라는 말을 쓰지 않았다. 왜냐하면 어떤 velog 글을 보게 되었는데 velog.io/@mowinckel/%EC%9B%B9-%ED%81%AC%EB%A1%A4%EB%A7%81-I 🖨 '웹 크롤러' 좀 그만 만들어라 아무튼 그만 만들어라. velog.io 해당 글에서 나온 크롤링의 정의를 보고 내가 잘못 알고있었구나 라는걸 깨달았기 때문이다. 또한 직접 수집해보며 느낀점으로는 해당 page가 리뉴얼해 html tag나 구조가 변.. 2021. 4. 1.
네이버 기사 댓글 가져오기 네이버 기사 댓글 가져오기 들어가기 전 네이버의 robots.txt 에 대해 먼저 숙지하자. 사용 언어 및 모듈 - python 3.7 - request = request 요청을 보내 html 값을 가져오기 - bs4 (BeautifulSoup) = 받은 html 값을 요소별로 구분하기 - pandas = 구분한 값을 보기 편하게 - tqdm = 얼만큼 진행되었는지 보기 위해 - random = 요청보내는 시간을 random하게 조절 - time = 한번 요청을 보내고 잠시 대기 하기 위해 네이버 영화 평에 이어 네이버 댓글을 가져오고 싶어졌다. 이유는 문장생성 때문. 영화평으로 문장을 생성하면 잘 만들어진 결과가 input : "이" => output : "이 영화 너무 재밌어요!" 정도. 한마디로 성.. 2021. 3. 29.
네이버 영화평 가져오기 네이버 영화평 가져오기 설명 들어가기 전 네이버의 robots.txt 에 대해 먼저 숙지하자. 사용 언어 및 모듈 - python 3.7 - request = request 요청을 보내 html 값을 가져오기 - bs4 (BeautifulSoup) = 받은 html 값을 요소별로 구분하기 - pandas = 구분한 값을 보기 편하게 - tqdm = 얼마나 진행되었는지 보기 위해 - random = 요청 보내는 시간을 불규칙하게 조절 - time = 한번 요청을 보내고 잠시 대기 하기 위해 네이버 영화평 corpus 가 이미 존재한다. (ref. github.com/e9t/nsmc) 총 20만개로 다들 이걸로 모델도 만들고, 감성분석도 수행하지만... 나는 데이터가 좀 더 많이 있었으면 좋겠다고 생각했다... 2021. 3. 29.
반응형