반응형
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- bash
- FreeBSD
- 포인터
- Preprocessor
- TiKV
- 컴퓨터 강좌
- Programming
- getopts
- 포인터변수
- 커널
- UNIX
- 약어
- Pointer
- 함수포인터
- OS 커널
- kernel
- 한빛미디어
- DBMS 개발
- Golang
- TiDB
- newSQL
- 구조와 원리
- Symbol
- SQLite
- 긴옵션
- 전처리기
- UNIX Internals
- go
- DBMS
- Windows via c/c++
Archives
- Today
- Total
sonumb
DataOps 에 관한 글들 (링크) 본문
출처: https://www.hitachivantara.com/ko-kr/insights/dataops-insights/dataops/what-is-dataops.html
DataOps란? 데이터 운영에 관한 모든 것.DATAOPS 란 무엇입니까? DataOps는 AI 시대를 위한 기업 데이터 관리입니다. DevOps에서 얻은 교훈을 데이터 관리 및 분석에 적용합니다. DataOps를 효과적으로 배포하면 분석 솔루션 시장 출시 시간을 단축하고, 데이터 품질 및 준수를 개선하며 데이터 관리 비용이 절감되는 것으로 나타났습니다.
데이터 운영은 제품이나 서비스 또는 솔루션이 아니라 방법론입니다. 협업과 자동화를 통해 조직의 데이터 활용을 개선하려는 기술적이자 문화적인 변화입니다. DATAOPS 플랫폼이란 무엇입니까?
DataOps 는 별개의 기술 플랫폼이라기보다는 하나의 접근방식 또는 방법론입니다. 다양한 데이터 기술과 사용 관행을 통합 환경 안에 조합하는 것을 의미합니다. 이 시스템에서 데이터는 소스에서 데이터 정제소 및 데이터 저장소를 통해 최종 사용까지 손쉽게 흐르면서 비즈니스에 긍정적인 영향을 줍니다. 이 과정에서 기업의 기술, 프로세스 및 인재는 효과적인 결론에 꼭 필요한 요소입니다.
DATAOPS 프레임 워크란 무엇입니까? DataOps의 프레임 워크는 기술에서 완전한 문화 변화에 이르는 5가지 필수 요소를 결합합니다. 첫째 요소는 DataOps를 가능하게 하는 기술입니다. 이미 기업에 있는 다수의 기술(IT 자동화, 데이터 관리 도구 포함)과 AI, 머신러닝(ML) 등의 기술을 말합니다. 두 번째는 주요 기술, 서비스 및 프로세스의 지속적인 혁신을 지원하는 적응형 아키텍처입니다. 세 번째는 데이터를 보강하여 정확한 분석을 위한 유용한 컨텍스트로 만드는 것입니다. 셋째 요소는 시스템에서 자동으로 생성되는 지능형 메타 데이터입니다. 때로는 수집 단계에서 메타 데이터가 생성되어 나중에 데이터 파이프라인에서 시간을 줄여줍니다. 넷째 요소는 기업의 데이터 관리 및 모델 관리 방침에 따라 분석과 데이터 파이프라인을 구축하고 배포할 DataOps 방법입니다. 다섯째 요소는 가장 중요하면서도 가장 어려운 것으로, 바로 문화와 사람입니다. DataOps의 잠재력을 실현하려면 IT 및 클라우드 운영, 데이터 아키텍처 및 엔지니어링, 데이터 분석가 및 데이터 과학자와 같은 데이터 소비자 간의 협업 문화를 구축하거나 구축해야합니다. 그래야 비로소 적시에 올바른 데이터를 올바른 장소에 배치하여 실제 비즈니스 가치를 촉진할 수 있습니다.
DATAOPS 아키텍처란 무엇입니까? 데이터 요건과 데이터 사용량이 지속적으로 급변할 때 DataOps 아키텍처는 중대한 적응력을 요구합니다. 비즈니스 우선순위와 시장 상황이 변함에 따라 기업의 데이터 소비자(데이터 분석가, 데이터 과학자 및 비즈니스 관리자)에게는 전과 다른 새로운 요구 사항이 발생합니다. 적응형 아키텍처는 이러한 변화를 수용하고 이에 적응하므로 매 단계마다 데이터 흐름과 인사이트의 질이 개선됩니다.
성공적인 DataOps 아키텍처는 기업 전체의 협업을 지원하고 또 요구합니다. 데이터 소비자가 데이터를 이용하고 비즈니스 계획에 사용할 인사이트를 추출할 때 데이터는 물론 그 데이터가 통과하는 데이터 파이프라인을 신속하게 구축하고 그 형태를 만들 수 있어야 합니다. 아키텍처가 이러한 데이터 운영을 가능한 한 쉽고 편리하게 만들어야 DataOps의 채택과 스마트 비즈니스가 촉진됩니다. DATAOPS를 어떻게 구현합니까? 이것은 규모와 범위가 어마어마한 질문이므로 데이터의 완전한 잠재력에 도달하기 위한 여정의 주요 포인트 또는 단계를 5가지로 요약해서 알려드리겠습니다. 기술 포트폴리오 및 프로세스를 시작, 평가 및 조정하여 중복성을 제거하고 팀 내에서 제어를 통합합니다. 그런 다음 팀을 통합하여 공유를 장려하고 협업을 방해하는 불일치를 줄입니다. 셋째, 여러 부서와 데이터 파이프라인에서 DataOps 관행을 통합하십시오. 협업 과정에서 직원들은 익숙하지 않은 프로세스를 처리해야 하고 전에 함께 일한 적이 없는 다른 팀을 믿어야 하기 때문에 이 단계가 어려운 경우가 많습니다.
넷째, 직원들 사이에서 어느 정도 정리가 끝났으면 이제는 프로세스를 자동화할 때입니다. 자동화하면 데이터 파이프라인의 효율성이 증가하며 데이터 운영의 효과가 개선됩니다. 아직 끝이 아닙니다. 마지막 여섯째 단계에서는 데이터 소비자에게 스스로 데이터 이용권을 부여해야 합니다. 이 단계에 가서야 비로소 데이터가 정보와 인사이트로 신속하게 변환되어 DataOps의 힘을 드러내고 조직에 미치는 효과를 눈으로 확인할 수 있습니다. 데이터 운영의 모든 요소를 다시 살펴보고 프로세스를 세심하게 측정하여 강력한 인사이트를 지속적으로 얻을 수 있도록 꾸준히 개선하고 적응하며 업그레이드하는 것도 잊지 마십시오. DATAOPS 도구란 무엇입니까? 다양한 기술과 프로세스는 기업 안에서 DataOps를 가능하게 해줍니다. 예를 들면 데이터 관리 기술(데이터 카탈로그, 데이터 가상화, 데이터 파이프라인 및 AI 모델 관리)은 물론 버전 작성, 테스트 자동화, 배포 자동화와 릴리스 관리 및 런타임 조정, 심지어 협업을 위한 기술 등이 여기에 포함됩니다. 테스트 및 배포 자동화 기술은 AI와 러닝머신을 사용하여 업무 프로세스와 워크플로우를 지원하므로 수동으로 구성할 필요가 없습니다. 상호운용성의 장벽을 낮추는 데에도 기술을 사용하는 것이 좋습니다. 여러 기술을 단일 토대로 통합하든 상호 운영 가능한 기술 집합을 형성하든, 이런 기술은 현재와 미래의 모든 데이터 환경(온프레미스, 클라우드, 멀티 클라우드 및 하이브리드)에서 작동해야 합니다.
스마트 메타 데이터는 매우 중요합니다. 스마트 기술을 포괄적인 AI, 러닝머신과 함께 사용하면 지능형 메타 데이터가 이것들을 이용해 추론 기능을 개선합니다. 수집 단계에서 메타 데이터를 자동으로 생성하면 런타임에서 자동으로 감지하고 그에 따라 데이터 객체에 태그가 붙으므로 수동 작업이 크게 줄어듭니다. 그 결과 데이터 파이프라인 개발에 속도가 붙고 각 부서에서는 DataOps 채택과 효과적인 분석이 가속화됩니다. DATAOPS 엔지니어란 무엇입니까? DataOps는 방법론이며 협업을 중심으로 하는 심적 태도이므로 엔지니어나 다른 직무 담당자 한 명만으로 성공할 수 없습니다. DataOps에서는 IT 직원부터 데이터 전문가, 데이터 소비자까지 협업 범위가 확장됩니다. 고립된 사고와 테러리스트는 팀 간 협업을 무너뜨리고 데이터가 회사 전체에 속한다는 이해를 와해시킵니다.
개별 기술이 회사 전체의 활동을 방해한다는 뜻이 아니라 부서마다 기존에 보유하던 기술을 다르게 사용한다는 뜻입니다. 데이터 엔지니어링, 데이터 품질, 데이터 프로파일링, 데이터 과학, 데이터 관리 등은 여전히 꼭 필요하고 유용합니다. 이제는 DataOps 인프라에서 데이터와 비즈니스를 분석하는 데이터 소비자에게 데이터를 공급합니다. DataOps를 통해 데이터 소비자가 스스로 신속하게 데이터를 탐색하는 능력이 향상됩니다. 데이터 관리인의 역할이 바뀌어 이제는 데이터 품질을 높이고 메타 데이터를 강화하라는 요구를 받고 있습니다. 물론 데이터를 가져오고 데이터 간격을 찾아 채우는 데이터 엔지니어는 존재하며 IT 직원과 운영 직원들이 데이터 운영을 관리하고 최적화하는 것도 여전합니다. 서비스로서의 DATAOPS란 무엇입니까? DataOps는 방법론이기 때문에 서비스로서의 스토리지(SaaS) 제품으로 제공되는 제품이 아닙니다. 그러나 SaaS는 마이크로 서비스, 조정 및 데이터 흐름 관리를 조직에 추가하는 DataOps 실행의 일부일 수 있습니다. 필수 DataOps 도구 몇 가지는 SaaS 구현 모델에서 얻을 수 있습니다.
오늘날 누가 DATAOP를 하고 있습니까? 빠르게 답하자면 DataOps의 잠재력을 완전히 실현한 기업은 아직 없으며 지속적인 개선이 필요합니다. 그럼에도 불구하고 다른 기업보다 한참 앞선 기업은 있습니다. 대규모 DataOps 전담 부서가 있고 DataOps 계획도 지원하는 첨단 기업이 대부분입니다. 그러나 폭넓게 보면 이미 많은 조직에서 미처 알지 못한 채 혹은 명칭을 붙이지 않은 채 어떤 형태로든 DataOps를 실행하고 있을지도 모릅니다. 데이터 민첩성 계획은 DataOps 계획과 긴밀하게 연결되는 경우가 많습니다.
Hitachi는 자체 비즈니스에 DataOps를 실행하고 있습니다. 예를 들어 객체 저장소와 Pentaho를 이용하여 기업 분석과 보고 및 IoT 플랫폼을 데이터 레이크 아키텍처에 배치했습니다. 그 결과 효율이 높아졌고 운영비가 줄었으며 신규 비즈니스 기회가 증가했습니다. 데이터 분석 운영은 30% 개선되었고 데이터 품질과 일관성은 50% 이상 향상되었으며 플랫폼 운영비는 20% 절감했습니다. 이것을 DataOps 사용 시 이점이라고 부릅니다. DATAOPS와 DEVOPS의 차이는 무엇입니까? DataOps는 DevOps보다 넓은 새로운 개념입니다. DataOps는 DevOps와 마찬가지로 각 팀과 부서 간의 협업을 자동화하고 단순화하며 새로운 협업에 의존합니다. DevOps는 IT 부서 내에서 개발과 운영 사이에 협업을 구축합니다. DataOps는 IT부터 데이터 전문가, 데이터 소비자까지 기업 전체적으로 협업을 구축하고 또 요구합니다. DevOps가 IT의 효율을 높인다면 DataOps는 기업 전체의 효율을 높입니다.
둘 다 모든 목표를 포함하여 말단에서 말단까지 문제 전체를 다시 생각해야 합니다. DevOps는 Dev만의 문제 또는 Ops만의 문제가 아닌 DevOps의 문제로 문제의 범위를 확장합니다. DataOps는 데이터의 생성부터 사용까지 데이터 흐름을 통한 조직의 사고 방식을 같은 방식으로 확장합니다. 그러나 조직 전체가 데이터에 의존하므로 DataOps는 더 많은 그룹에 영향을 미칩니다. DataOps는 더 복잡하기도 합니다. DevOps에서는 구현 파이프라인(실행 코드)이 하나면 충분했지만 DataOps에서는 데이터 모델을 학습하고 데이터 흐름을 실행할 프로덕션 배포 및 데이터 파이프라인이 여러 개 필요합니다. 그리고 이것들 모두를 지속적으로 적응시키고 개선하며 측정해야 합니다. DATAOPS의 이점은 무엇입니까? 451 Research의 최근 연구인 "DataOps: 민첩성, 보안 및 혁신적인 변화의 토대 (en)" 보고서는 이미 DataOps 방법을 사용 중인 기업으로부터 얻은 중요한 인사이트를 제공합니다. 이 보고서의 결론은 아래와 같습니다.
DATAOPS 회사는 어디입니까?
Hitachi Vantara는 DataOps 기업입니다. DataOps를 개척하고 개발하여 비즈니스에 사용하며 고객 및 파트너의 DataOps 구축과 최적화를 위해 함께 노력하기 때문입니다. 거의 110년 동안 운영 기술을 다루었고 60년 이상 IT 업계에 몸담은 까닭에 DataOps 분야에 있어서 그 누구보다 깊은 경험을 지닌 Hitachi는 가치로 향하는 데이터 계단 즉, SEAM이라고 부르는 다양한 지원 제품을 통해 고객이 DataOps의 이점을 알아가도록 지원합니다. 고객들은 다음 사항에 Hitachi 제품을 사용합니다.
- 저장: 에지, 프라이빗, 하이브리드 및 멀티 클라우드 솔루션에서 올바른 서비스 수준으로 최저 가격에 데이터를 저장, 관리 및 보호합니다. - 풍성화: 지능형 데이터 관리와 거버넌스에 맥락을 마련해 주는 메타 데이터 분류 및 카탈로그 작성으로 데이터를 풍성화합니다. - 활성화: 기업 데이터 자산을 발견, 통합, 조정하고 분석을 이용하여 기업의 모든 상호작용과 애플리케이션에 실행할 수 있는 인사이트를 생성합니다. - 수익화: 고객의 기업 내부와 그 너머까지 모든 데이터의 경제적 가치를 완전하게 포착한 결과를 전달합니다. 고객과 함께 혁신하면서 고객의 비전을 성공적으로 실현해 줄 Hitachi Vantara를 선택해야 합니다. Hitachi는 항상 고객이 추진하려는 비즈니스의 결과에서 시작합니다. 이러한 접근방식과 Hitachi만의 업계 노하우를 결합하여 SEAM의 매 단계에서 데이터의 가치를 극대화하는 통합 시스템을 구현합니다. 매 단계를 우수하게 실행하여 다음 단계의 성공을 보장하며 고객이 디지털 성숙도에서 기었다가 걷고, 다시 뛸 수 있도록 하여 진정한 DataOps 이점을 누리도록 돕습니다. |
https://nch1234.tistory.com/1102
https://www.ciokorea.com/news/174384
https://zdnet.co.kr/view/?no=20200816110619
https://blog.naver.com/mage7th/221633566346
https://www.2e.co.kr/news/articleView.html?idxno=210579
https://www.2e.co.kr/news/articleView.html?idxno=210844
https://www.2e.co.kr/news/articleView.html?idxno=210869
참고: 데이터옵스 프레임워크 공모 문서
https://ezone.iitp.kr/common/anno/02/form.tab?PMS_TSK_PBNC_ID=PBD202100000105
RFP 120번을 참고.
반응형