Data Analysis 데이터 분석 79

percent_rank()

`PERCENT_RANK()`는 SQL의 윈도우 함수로, 특정 행의 상대적 순위를 백분율로 나타내는 데 사용됩니다. 이 함수는 데이터 집합에서 각 행의 상대적 위치를 계산하여, 그 결과를 0과 1 사이의 값으로 반환합니다. ### 구문 ```sql PERCENT_RANK() OVER (PARTITION BY partition_expression ORDER BY order_expression) ``` - **`PARTITION BY partition_expression`** (선택적): 데이터를 그룹화하여 각 그룹 내에서 백분율 순위를 계산합니다. 지정하지 않으면 전체 데이터 집합에서 계산됩니다. - **`ORDER BY order_expression`**: 백분율 순위를 계산할 때 사용하는 정렬 기준입니..

dense_rank() , rank, row number 동일한 값 있을 경우 예시

`DENSE_RANK()`, `RANK()`, 그리고 `ROW_NUMBER()`는 모두 SQL의 윈도우 함수로, 데이터 집합에서 행의 순위를 계산하는 데 사용됩니다. 각 함수는 순위를 부여하는 방식이 다릅니다. ### 차이점 1. **`ROW_NUMBER()`** - 각 행에 대해 고유한 순위를 부여합니다. - 동일한 값이 있는 경우에도 각 행에는 고유한 순위가 부여됩니다. - 순위가 연속적이지 않을 수 있습니다. 2. **`RANK()`** - 동일한 값이 있는 행들에 대해 동일한 순위를 부여합니다. - 동일한 순위를 부여받은 행들의 순위 뒤에는 건너뛴 순위가 부여됩니다. - 예를 들어, 두 행이 순위 2를 가질 경우, 다음 행은 순위 4가 됩니다. 3. **`DENSE_RANK()`** - 동일한 값..

오라클 데이터베이스

오라클 데이터베이스는 **IE 표기법 (Information Engineering)**을 주로 사용합니다. ### IE 표기법 (Information Engineering) - **사각형**: 엔티티를 나타냅니다. - **마름모**: 관계를 나타냅니다. - **직선**: 엔티티 간의 관계를 연결합니다. - **1:1, 1:N, M:N** 등의 관계를 표시할 때는 직선에 숫자나 문자로 표시합니다. - **관계명**은 직선 위에 위치하거나 가까이에 적습니다. ### Barker 표기법 - **박스**: 엔티티를 나타냅니다. - **관계는 화살표와 다리**로 표현하며, 관계의 선택성과 필수성을 명확하게 시각적으로 표현합니다. - **1:1, 1:N, M:N** 등의 관계를 박스의 옆에 숫자나 문자로 표시합니다..

각각의 트랙잭션이 영향 주는 칼럼이 같을 때 값이 어떻게 되니

두 개의 트랜잭션이 동시에 동일한 칼럼을 수정하려고 할 때, 트랜잭션이 서로 영향을 주지 않도록 데이터베이스 시스템은 여러 가지 방법으로 이를 관리합니다. 이러한 상황은 **동시성 제어**와 관련이 있으며, 데이터베이스의 트랜잭션 격리 수준에 따라 결과가 달라집니다. ### 가능한 시나리오 1. **트랜잭션 1**이 특정 칼럼 값을 업데이트하고 있는 동안, **트랜잭션 2**도 동일한 칼럼을 업데이트하려고 시도합니다. 2. 두 트랜잭션이 동시에 실행될 수 있는 환경에서, 데이터베이스는 각 트랜잭션이 해당 칼럼에 대해 서로 다른 값을 설정하려고 할 때 어떻게 처리할지를 결정합니다. ### 격리 수준에 따른 처리 방식 1. **Read Uncommitted (읽기 미완료)**: - **트랜잭션 1**이 데이..

이커머스, 카탈로그, 라벨링, 머신러닝

ChatGPT이커머스 산업에서 카탈로그의 데이터 라벨링을 하고 상품의 정확한 카테고리를 예측하기 위한 시스템을 구축하는 데 있어서 머신러닝은 여러 측면에서 유용하게 사용될 수 있습니다.  다음은 주요 활용 사례들입니다:카테고리 예측:1-1. 텍스트 분류: 상품 설명, 제목, 리뷰 등의 텍스트 데이터 -> 해당 상품의 카테고리를 자동예측이를 위해서는 텍스트 데이터를 벡터화하고, 이를 분류할 수 있는 머신러닝 모델(예: Naive Bayes, SVM, Random Forest, 딥러닝 모델 등)을 학습시킵니다. 1-2. 이미지 분류: 상품 이미지 데이터 -> 이미지 기반으로 카테고리 예측. CNN(Convolutional Neural Network)과 같은 딥러닝 모델을 활용하여 이미지를 분류합니다. 2. ..

데이터베이스 관리의 중요성

데이터베이스 관리의 중요성데이터베이스 관리는 소프트웨어 개발 및 비즈니스 운영의 중요한 측면대용량 데이터를 효율적으로 처리데이터 무결성과 일관성을 유지하며, 데이터 보안을 보장https://appmaster.io/ko/blog/deiteobeiseu-gwanriran-mueosibnigga  모든 데이터 기반 애플리케이션 또는 기업의 중요한 측면효율적이고 효과적인 데이터베이스 관리 = 비즈니스 프로세스와 의사결정에 큰 영향   데이터 무결성 : 데이터베이스에 저장된 데이터의 정확성과 일관성 보장데이터 유효성 검사, 제약 조건 및 참조 무결성 규칙 구현 -> 정보에 입각한 비즈니스 결정을 내리기 위한 기반을 형성하는 고품질 데이터 유지데이터 보안 : 데이터 보호는 기업의 최우선 과제데이터베이스 관리 시스템..

데이터베이스 관리 시스템 유형

데이터베이스 관리 시스템 유형  계층적 DBMS: 이 시스템은 데이터 요소가 부모-자식 관계로 연결되는 트리형 구조ex.IBM의 IMS(정보 관리 시스템) 및 Windows 레지스트리 네트워크 DBMS: 네트워크 DBMS는 데이터 요소에 대해 여러 상위-하위 관계를 허용하는 주요 기능을 통해 관련 데이터를 연결하는 데 더 큰 유연성을 제공합니다. ex. 통합 데이터 저장소(IDS) 및 Raima 데이터베이스 관리자(RDM) 객체 지향 DBMS(OODBMS): 데이터베이스와 프로그래밍 개념을 결합한 객체 지향 데이터베이스는 프로그래밍 객체의 원활한 저장 및 관리를 가능하게 합니다. OODBMS는 멀티미디어 및 지리 정보 시스템(GIS)과 같은 복잡한 데이터 유형 처리하는 데 특히 유용합니다. ex. Obj..

데이터베이스 관리 시스템의 주요 구성 요소

데이터베이스 관리 시스템의 주요 구성 요소일반적인 DBMS의 주요 구성 요소 데이터베이스 엔진 : 데이터베이스의 데이터 저장, 검색 및 업데이트를 담당- 데이터가 일관되고 안전하게 저장되도록 보장하고 데이터베이스 스키마에 지정된 규칙을 적용합니다. 데이터 정의 : 데이터베이스의 구조를 생성/수정,이 구성 요소는 테이블, 뷰, 인덱스와 같은 데이터베이스 개체를 생성, 변경, 제거하는 데 중점 데이터 조작 : 데이터 입력, 업데이트, 삭제, 검색의 필수작업DBMS의 데이터 조작 구성 요소는 데이터베이스에 저장된 데이터와 상호 작용하는 도구와 기술을 제공 데이터베이스 스키마= 데이터베이스 : (오라클에서는 다르지만) 데이터베이스 구조의 청사진이며 테이블과 테이블 간의 관계 정의이 메타데이터를 통해 DBMS는 ..

Sql 명령어

mysql -u root -p로 접속  Show databases; 로 모든 데이터베이스 조회  (데이터베이스 = 스키마)Create database; ‘데이터베이스명' Drop database; ‘데이터베이스 명’  Use ‘데이터베이스명' Show tables; (데이터베이스에 있는 모든 테이블 보기) Select * from ‘테이블 이름' Select * from ‘테이블 이름' WHERE ‘컬럼명’ (행) = ‘찾는 데이터’ :  필요한 카테고리에 대한 정확한 값을 가진 전체 정보를 (행) 필터 Select * from ‘테이블 이름' FROM ‘테이블 이름' : 테이블에서 필요한 카테고리(세로)(열)만 필터 가져옴 Create table ‘테이블 명' (id INT(11) NOT NULL Au..