1.
ESQUEMA
a.
PS: Discorrer sobre aumento da escalabilidade,
entretanto sem garantia da integridade dos dados.
b.
O quanto a ausência de esquema ou esquema flexível
do banco de dados não relacional afeta na integridade dos dados?
2.
INTEGRIDADE
a.
PS: Discorrer sobre os princípios ACID
(relacional) e BASE (não-relacional)
b.
Quando não consideramos a integridade no banco
relacional, qual a diferença ao comparar com o banco não relacional? O
desempenho é o mesmo?
i.
Os tweets do twitter possuem uma id própria, que
é usada como chave primária do tweet no banco de dados. Essa id é criada e
verificada pelo próprio twitter. Logo é realmente necessário validar a chave
primária?
3.
ARQUITETURA
a.
Diferença de arquitetura/implementação do banco
relacional para o banco não relacional
b.
O banco não relacional traz alguma melhoria
nesse sentido?
4.
STREAMING
a.
Quanto, do total de tweets naquele segundo, o
streaming coleta? Como ele filtra essa coleta?
b.
Como igualar/definir quantidade de bits/tuplas
tamanho médio dos tweets que estão sendo coletados?
5.
TESTES
a.
Como serão realizados os testes?
i.
Coleta ao mesmo tempo? Diferentes tempos?
ii.
Mesma configuração de máquina?
iii.
Diferentes dados? Mesma quantidade?
iv.
Obs: Usar temas populares para comparar
b.
Como esquematizar os testes?
i.
Permitir reproduzir depois.
c.
O que será avaliado no resultado dos testes?
i.
Como validar esse resultado?
Nenhum comentário:
Postar um comentário