Skip to content

Cache dos dados em formato CSV ou TSV #53

@waldyrious

Description

@waldyrious

O formato do JSON para a cache dos dados do Wikidata (#47) é consideravelmente ruidoso e ocupa bastante espaço com dados que não precisamos.

Exemplo do JSON que temos agora:
-{
-    "head": {
-        "vars": [
-            "item",
-            "itemLabel",
-            "geo"
-        ]
-    },
-    "results": {
-        "bindings": [
-            {
+                "geo": {
-                    "datatype": "http://www.opengis.net/ont/geosparql#wktLiteral",
-                    "type": "literal",
+                    "value": "Point(-9.147787 38.706746)"
-                },
+                "item": {
-                    "type": "uri",
+                    "value": "http://www.wikidata.org/entity/Q99845706"
-                },
+                "itemLabel": {
-                    "type": "literal",
+                    "value": "A Pequena Galeria",
-                    "xml:lang": "pt"
-                }
-            },
-            {
+                "geo": {
-                    "datatype": "http://www.opengis.net/ont/geosparql#wktLiteral",
-                    "type": "literal",
+                    "value": "Point(-16.90333 32.64816)"
-                },
+                "item": {
-                    "type": "uri",
+                    "value": "http://www.wikidata.org/entity/Q76955108"
-                },
+                "itemLabel": {
-                    "type": "literal",
+                    "value": "Capela de Nossa Senhora da Oliveira",
-                    "xml:lang": "pt"
-                }
-            }
-        ]
-    }
-}
Exemplo do JSON que realmente precisamos:
- [
-    {
+        "item": "http://www.wikidata.org/entity/Q99845706",
+        "itemLabel": "A Pequena Galeria",
+        "geo": "Point(-9.147787 38.706746)"
-    },
-    {
+        "item": "http://www.wikidata.org/entity/Q76955108",
+        "itemLabel": "Capela de Nossa Senhora da Oliveira",
+        "geo": "Point(-16.90333 32.64816)"
-    }
-]

Ou ainda melhor, em TSV:

item	itemLabel	geo
http://www.wikidata.org/entity/Q99845706	A Pequena Galeria	Point(-9.147787 38.706746)
http://www.wikidata.org/entity/Q76955108	Capela de Nossa Senhora da Oliveira	Point(-16.90333 32.64816)

Não sei se ao implementarmos a conversão para GeoJSON (#48) iremos substituir os dados e a forma como montamos o mapa.html; mas caso decidamos manter os dados brutos em paralelo ao GeoJSON, pode ser vantajoso usar um formato mais compacto e mais legível. Citando o meu comentário em #47:

talvez possamos fazer o download em csv ou tsv? Assim os ficheiros ficam mais pequenos, e até fica mais fácil consultá-los no github porque são mostrados como tabelas.

Metadata

Metadata

Assignees

No one assigned

    Labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions