Base de Dados

Pima Indians Diabetes

Link download: https://www.kaggle.com/uciml/pima-indians-diabetes-database
Descrição: Esta base de dados é original do Instituto Nacional de Doenças da Diabetes, Digestivas e dos Rins (National Institute of Diabetes and Digestive and Kidney Disease). O objetivo desta base de dados é para realizar uma predição baseada em medidas de diagnóstico se um paciente possui ou não diabetes.

A tabela a seguir apresenta detalhes das características da base de dados.

Atributo Descrição Tipo
Pregnancies Número de vezes grávida Numérico
Glucose Concentração plasmática de glicose por 2 horas em teste oral de tolerância à glicose Numérico
BloodPressure Pressão arterial diastólica (mm Hg) Numérico
SkinThickness Espessura da dobra da pele do tríceps (mm) Numérico
Insulin 2-Hour serum insulin (mu U/ml) Numérico
BMI Índice de massa corporal (peso em kg / (altura em m)^2) Numérico
DiabetesPedigreeFunction Função de pedigree de diabetes Numérico
Age Idade (em anos) Numérico
class (Outcome) Class variable (0 or 1) 268 of 768 are 1, the others are 0 Categórico

Íris

Link download: https://archive.ics.uci.edu/ml/datasets/iris
Descrição:

A tabela a seguir apresenta detalhes das características da base de dados.

Atributo Descrição Tipo
Sepal_Length Comprimento da sépala Numérico
Sepal_Width Largura da sépala Numérico
Petal_Length Comprimento da pétala Numérico
Petal_Width Largura da pétala Numérico
class Tipo da planta. Domínio: Iris-setosa, Iris-versicolour ou Iris-Virginica Categórico

Titanic

Link download: https://www.kaggle.com/c/titanic/data
Descrição:

A tabela a seguir apresenta detalhes das características da base de dados.

Característica Descrição Tipo
class Classe do passageiro categórico
survived Se o passageiro sobreviveu ou não categórico
name Nome do passageiro categórico
sex Sexo do passageiro categórico
age Idade do passageiro numérico
sibsp Número de irmãos/esposa presente numérico
parch Número de pais/filhos presentes numérico
ticket Número do ticket categórico
fare Tarifa de embarque numérico
cabin Cabine do passageiro categórico
embarked Porto em que o passageiro embarcou categórico
boat Identificação do barco salva-vidas categórico
body Número de identificação do corpo categórico
homedest Destino categórico

Funcionários

Link download:
Descrição:\

A tabela a seguir apresenta detalhes das características da base de dados.

Atributo Descrição Tipo
id
nome_cargo Nome dos cargos existentes String

Artificial 1

Link download:
Descrição: O conjunto de dados 1 possui os atributos “A” e “key”, o conjunto de dados 2 têm os atributos “B” e “key”. Observe que o atributo key é comum aos dois conjuntos de dados.

Entrada de dados 1

A key
A0 K0
A1 K1
A2 K2
A3 K3
A4 K4
A5 K5

Entrada de dados 2

B key
B0 K0
B1 K1
B2 K2

Weather

Link download:
Descrição: temperaturas entre Outubro de 2012 e Outubro de 2013 das cidades de New York, San Francisco e Austin.

A tabela a seguir apresenta detalhes das características da base de dados.

Atributo Descrição Tipo
date data da temperatura date
New_York temperatura na cidade de New York float
San Francisco temperatura na cidade de San Francisco float
Austin temperatura na cidade de Austin float

Wine

Link download: https://archive.ics.uci.edu/ml/datasets/wine
Descrição:

A tabela a seguir apresenta detalhes das características da base de dados.

Atributo Descrição Tipo
class Classe caracterizando o reconhecimento do vinho Categórica (1, 2 ou 3)
Alcohol Teor alcoólico Numérico
Malic acid Ácido málico Numérico
Ash Cinza Numérico
Alcalinity of ash Alcalinidade das cinzas Numérico
Magnesium Magnésio Numérico
Total phenols Fenóis totais Numérico
Nonflavanoid phenols Fenóis inflavonóides Numérico
Proanthocyanins Proantocianidinas Numérico
Color intensity Intensidade da cor Numérico
Hue Matiz Numérico
OD280/OD315 of diluted wines OD280 / OD315 de vinhos diluídos Numérico
Proline Prolina Numérico

Faixa Etária

Link download: https://drive.google.com/open?id=1lw9bmLpfzcF-JRWFn6JtgQXtWJAWCjzR
Descrição: quantidade de pessoas em diferentes faixas etárias no estado da Califórnia. Estas faixas etárias são: Menos que 5 anos, 5 - 13 anos, 14 - 17 anos, 18 a 24 anos, 25 a 44 anos, 45 a 64 anos, Mais do que 65 anos.

A tabela a seguir apresenta detalhes das características da base de dados.

Atributo Descrição Tipo
rotulo categoria da faixa etária String
valor quantidade de pessoa com determinada faixa etária Inteiro

População Americana

Link download:
Descrição: quantidade de pessoas em diferentes faixas etárias em 6 diferentes estados: Califórnia, Texas, New York, Flórida, Illinois e Pennsylvania. Estas faixas etárias são: Menos que 5 anos, 5 - 13 anos, 14 - 17 anos, 18 a 24 anos, 25 a 44 anos, 45 a 64 anos, Mais do que 65 anos.

A tabela a seguir apresenta detalhes das características da base de dados.

Atributo Descrição Tipo
state estado nos Estados Unidos String
Under_5_Years quantidade de pessoas com idade até 5 anos Inteiro
5_to_13_Years quantidade de pessoas com idade entre 5 e 13 anos Inteiro
14_to_17_Years quantidade de pessoas com idade entre 14 e 17 anos Inteiro
18_to_24_Years quantidade de pessoas com idade entre 18 e 24 anos Inteiro
25_to_44_Years quantidade de pessoas com idade entre 25 e 44 anos Inteiro
45_to_64_Years quantidade de pessoas com idade entre 45 e 64 anos Inteiro
65_Years_and_Over quantidade de pessoas com idade acima de 65 anos Inteiro

Belgium retail

Link download: http://fimi.ua.ac.be/data/retail.dat
Descrição: cada linha um transação, cada transação tem um ou mais itens (eles não se repetem na mesma transação).

msnbc.com

Link download: https://kdd.ics.uci.edu/databases/msnbc/msnbc.data.html
Descrição: estes dados descrevem as visitas em páginas por usuários que visitaram o msnbc.com em 28 de setembro de 1999.

mtcars.com

Link download: https://gist.github.com/seankross/a412dfbd88b3db70b74b
Descrição: A base de dados mtcars é comumente usada em exemplos de regressão, ela constitui de informações retiradas da revista 1974 Motor Trend US e resume 10 aspectos do design de 32 carros assim como o consumo de gasolina.

Siape

Link download: http://www.unitfour.com.br/guia-de-solucoes/base-de-dados-por-siape
Descrição: A base de dados siape possui informações sobre funcionários públicos. Essa base possui diversos atributos, tais como “nome_servidor”, “idade”, “faixa_etaria”, “sexo”, “estado_civil” etc.

Quotes

Link download:
Descrição: A base de dados quotes contém citações e o autor que as escreveu. A base possui os atributos “quote” e “author”.

Sentiment Labelled Sentences

Link download: https://archive.ics.uci.edu/ml/datasets/Sentiment+Labelled+Sentences
Descrição: Esse conjunto de dados contém frases marcadas com sentimento positivo (1) ou negativo (0) coletadas em três diferentes sites: imdb.com, amazon.com e yelp.com. Para cada site, existem 500 frases positivas e 500 sentenças negativas. Utilizaremos apenas as frases extraídas de imdb.com.

Auto MPG

Link download: https://archive.ics.uci.edu/ml/datasets/Auto+MPG
Descrição: possui a relação com o consumo de combustível, em milhas por galão, de diversos automóveis diferentes. US Baby Names Link download: https://www.kaggle.com/kaggle/us-baby-names/version/2 Descrição: possui nomes de bebês americanos.

Temperatura global por País

Link download: https://www.kaggle.com/berkeleyearth/climate-change-earth-surface-temperature-data#GlobalLandTemperaturesByCity.csv
Descrição: Climate Change: Earth Surface Temperature Data

Aeroportos do Brasil

Link download: https://data.world/ourairports/a0a0b44c-834b-459f-9b68-35d90e3a27b6
Descrição: Todos aeroportos do Brasil

Airplane Crashes Since 1908

Link download: https://www.kaggle.com/saurograndi/airplane-crashes-since-1908
Descrição: Acidentes de avião.