SEMINÁRIO

DESIGNING, OPERATING, MANAGING AN
ENTERPRISE DATA LAKE

MIKE FERGUSON | 21 e 22 MAIO 2018 | LISBOA

INSCREVA-SE JÁ!

DESIGNING, OPERATING, MANAGING AN ENTERPRISE DATA LAKE
Governing your Information across Hadoop, Cloud Storage, Data Warehouses, MDM & NoSQL Data Stores

Este seminário de 2 dias analisa os desafios enfrentados pelas empresas que tentam lidar com um número crescente de fontes de dados, recolhendo dados em múltiplos tipos de armazenamento (nuvem e instalações locais), sistemas analíticos e requisitos para poder definir, governar, gerir e partilhar informações fiáveis de alta qualidade num ambiente de computação distribuído e híbrido. Também explora uma nova abordagem de como os arquitetos de dados de TI, utilizadores de negócio e developers de TI podem colaborar juntos na construção e gestão de um Data Lake lógico para obter o controlo dos seus dados. Isso inclui a entrada de dados, descoberta automatizada de dados, definição do perfil de dados e identificação e publicação de dados num data catalog. Também envolve a refinação de dados brutos para produzir serviços de dados empresariais que podem ser publicados num catálogo disponível para consumo em toda a sua empresa. Também apresentamos múltiplas configurações de Data Lake, incluindo um Data Lake centralizado e um Data Lake distribuído "lógico", bem como a execução de tarefas e governance em múltiplos tipos de fontes de dados. Enfatiza a necessidade de uma abordagem colaborativa comum para governar e gerir dados de todos os tipos.

A QUEM SE DESTINA

Este seminário destina-se a business data analysts que fazem integração de dados em self-service, arquitetos de dados, CDO, profissionais de MDM, profissionais de gestão de conteúdos, administradores de bases de dados, profissionais de Big Data, developers de integração de dados e responsáveis pela gestão de dados. Inclui gestão de metadados, integração de dados, qualidade de dados, gestão de dados principais e gestão de conteúdo empresarial. O seminário não é apenas para as empresas da escala das empresas citadas na Fortune 500, mas para qualquer organização que tenha de lidar com Big Data e volumes de dados pequenos, múltiplos tipos de armazenamentos de dados e múltiplas fontes de dados. Assume que o participante terá uma compreensão dos princípios básicos de gestão de dados, bem como um alto nível de compreensão dos conceitos de migração de dados, replicação de dados, metadados, armazenamento de dados, modelagem de dados, limpeza de dados.

INSCREVA-SE JÁ!

MIKE FERGUSON

Diretor-geral da Intelligent Business Strategies Limited

Mike Ferguson is Managing Director of Intelligent Business Strategies Limited. As an analyst and consultant he specialises in business intelligence / analytics, data management, big data and enterprise architecture. With over 35 years of IT experience, Mike has consulted for dozens of companies on business intelligence strategy, technology selection, enterprise architecture, and data management. He has spoken at events all over the world and written numerous articles. Formerly he was a principal and co-founder of Codd and Date Europe Limited – the inventors of the Relational Model, a Chief Architect at Teradata on the Teradata DBMS and European Managing Director of Database Associates. He teaches popular master classes in Big Data, Predictive and Advanced Analytics, Enterprise Data Governance, Master Data Management, Data Virtualisation, and Enterprise Data Lakes.

programa

objetivos

Os participantes irão aprender:

Como definir uma estratégia para produzir dados como-um-serviço fiáveis num ambiente distribuído de múltiplos tipos de armazenamentos de dados e fontes de dados;

Como organizar dados num ambiente de dados centralizado ou distribuído para superar a complexidade e o caos

Como projetar, construir, gerir e operar um Data Lake lógico ou centralizado dentro da sua organização;

A importância crítica de um catálogo de informações para entender que dados estão disponíveis como serviço;

Como a normalização de dados e os glossários empresariais podem ajudar a garantir que os dados sejam entendidos

Um modelo operacional para uma governança efetiva da informação distribuída;

Que tecnologias e metodologias de implementação precisam para controlar os seus dados;

Como aplicar metodologias para obter dados principais e de referência, big data, dados de armazéns de dados e dados não estruturados sob controlo, independentemente de residirem localmente ou na nuvem.

INSCREVA-SE JÁ!

Conteúdo Programático

MODULE 1: STRATEGY & PLANNING.
This session introduces the data lake together with the need for a data strategy and looks at the reasons why companies need it. It looks at what should be in your data strategy, the operating model needed to implement, the types of data you have to manage and the scope of implementation. It also looks at the policies and processes needed to bring your data under control.

MODULE 2: METHODOLOGY & TECHNOLOGIES.
Having understood strategy, this session looks at multiple methodologies and the technologies needed to help apply it to your structured and multi-structured data to bring it under control. It also looks at how platforms like Hadoop and common data services provide the foundation to manage information across the enterprise

MODULE 3: DATA STANDARDISATION, THE BUSINESS GLOSSARY AND THE INFORMATION CATALOG.
This session looks at the need for data standardisation of structured data and of new insights from processing unstructured data. The key to making this happen is to create common data names and definitions for your data to establish a shared business vocabulary (SBV). The SBV should be defined and stored in a business glossary and is important for information consumers to understand published data in a data lake. It also looks at the emergence of more powerful information catalog software and how business glossaries have become part of what a catalog offers.

MODULE 4: ORGANISING AND OPERATING THE DATA LAKE.
This session looks at how to organise data to still be able to manage it in a complex data landscape. It looks at zoning, versioning, the need for collaboration between business and IT and the use of an information catalog in managing the data.

MODULE 5: THE DATA REFINERY PROCESS.
This session looks at the process of refining data to get produce trusted information.

MODULE 6: REFINING BIG DATA & DATA FOR DATA WAREHOUSES.
This session looks at how the data refining processes can be applied to managing, governing and provisioning data in a Big Data analytical ecosystem and in traditional data warehouses. How do you deal with very large data volumes and different varieties of data? How do you load and process data in Hadoop? How should low-latency data be handled?

MODULE 7: INFORMATION AUDIT & PROTECTION – THE FORGOTTON SIDE OF DATA GOVERNANCE.
Over recent years we have seen many major brands suffer embarrassing publicity due to data security breaches that have damaged their brand and reduced customer confidence. With data now highly distributed and so many technologies in place that offer audit and security, many organisations end up with a piecemeal approach to information audit and protection. Policies are everywhere with no single view of the policies associated with securing data across the enterprise. The number of administrators involved is often difficult to determine and regulatory compliance is now demanding that data is protected and that organisations can prove this to their auditors. So how are organisations dealing with this problem? Are the same data privacy policies enforced everywhere? How is data access security co-ordinated across portals, processes, applications and data? Is anyone auditing privileged user activity? This session defines this problem, looks at the requirements needed for Enterprise Data Audit and Protection and then looks at what technologies are available to help you integrate this into you data strategy.

agenda
DATA: 21 e 22 maio 2018

DURAÇÃO: 2 dias

HORÁRIO: 09.00H – 13.00H / 14.00H – 18.00H

inscrição

VALOR DA INSCRIÇÃO

VALOR: 1.450€ + IVA

Inscrição válida após confirmação da Passio Consulting.

Número de Inscrições limitadas

OBRIGADO

pela sua inscrição no Seminário

DESIGNING, OPERATING, MANAGING AND ENTERPRISE DATA LAKE


Verifique o seu E-mail.

local

Hotel Olissippo Oriente – Lisboa
Av. Dom João II 32
1900-083 Lisboa | Portugal
* O hotel tem parque de estacionamento com um valor de 5€/ dia, para quem está no Seminário.
Hotel Olissippo Oriente – Lisboa
Av. Dom João II 32
1900-083 Lisboa | Portugal
* O hotel tem parque de estacionamento com um valor de 5€/ dia, para quem está no Seminário.