Projeto Final : Perguntas que devem ser respondidas

1. ESQUEMA

a. PS: Discorrer sobre aumento da escalabilidade, entretanto sem garantia da integridade dos dados.

b. O quanto a ausência de esquema ou esquema flexível do banco de dados não relacional afeta na integridade dos dados?

2. INTEGRIDADE

a. PS: Discorrer sobre os princípios ACID (relacional) e BASE (não-relacional)

b. Quando não consideramos a integridade no banco relacional, qual a diferença ao comparar com o banco não relacional? O desempenho é o mesmo?

i. Os tweets do twitter possuem uma id própria, que é usada como chave primária do tweet no banco de dados. Essa id é criada e verificada pelo próprio twitter. Logo é realmente necessário validar a chave primária?

3. ARQUITETURA

a. Diferença de arquitetura/implementação do banco relacional para o banco não relacional

b. O banco não relacional traz alguma melhoria nesse sentido?

4. STREAMING

a. Quanto, do total de tweets naquele segundo, o streaming coleta? Como ele filtra essa coleta?

b. Como igualar/definir quantidade de bits/tuplas tamanho médio dos tweets que estão sendo coletados?

5. TESTES

a. Como serão realizados os testes?

i. Coleta ao mesmo tempo? Diferentes tempos?

ii. Mesma configuração de máquina?

iii. Diferentes dados? Mesma quantidade?

iv. Obs: Usar temas populares para comparar

b. Como esquematizar os testes?

i. Permitir reproduzir depois.

c. O que será avaliado no resultado dos testes?

i. Como validar esse resultado?

Projeto Final

quinta-feira, 23 de abril de 2020

Perguntas que devem ser respondidas

Nenhum comentário:

Postar um comentário