根据地区编码获得地区名称
get_area_name(area_codes)
字符。长度为1的向量,带有3级区域集的名称,或者(如果该区域集没有名称)代码的输入向量。
与get_wgsrpd3_codes函数执行相反的功能。适用于压缩代码集,例如文件名、绘图和表格格式。
get_area_name(get_wgsrpd3_codes("Brazil"))
ℹ Matches to input geography found at Country (Gallagher) and Region (Level 2)
[1] "Brazil"
提取WGSRPD3级编码
get_wgsrpd3_codes(geography, include_equatorial = NULL)
具有属于该地理区域的区号(级别3)的字符。
国家绘图遵循加Gallagher et al. (2020)。重要的是,这意味着一些海外领土在此系统中不被视为国家的一部分,例如加那利群岛被指定为它们自己的 3 级区域,而不是此映射中西班牙的一部分。在不明确的地方,可以使用View(wgsrpd_mapping)来研究映射。
get_wgsrpd3_codes("Brazil")
ℹ Matches to input geography found at Country (Gallagher) and Region (Level 2)
[1] "BZC" "BZE" "BZL" "BZN" "BZS"
为给定的范围和范围质心绘制 POWO 样式地图。
powo_map(range_sf, centroids_sf)
该范围的ggplot地图
POWO网站上展示的范围地图有一个固定的、离散的调色板,它基于一个地区的分类群类型。
powo_pal()scale_color_powo(...)scale_colour_powo(...)scale_fill_powo(...)
字符。与POWO相匹配的名称和十六进制值的向量。
名称匹配的示例数据集。一个包含20个红名单评估样本的数据集,用于名称匹配
redlist_example
具有 20 行和 4 个变量的数据框:
从 / 下载并采样
用于将植物科映射到目或更高分类的数据。包含更高分类(被子植物、裸子植物、蕨类植物和石松植物)和 WCVP 中每个科的顺序的数据集。
taxonomic_mapping
一个包含457行和3个变量的数据框架:科、目和更高分类阶元
PPG I 中的蕨类植物和石松类植物分类学。来自APG IV的被子植物分类学。Forest 等人的裸子植物分类学。
从 WCVP 生成物种清单
wcvp_checklist(taxon = NULL,taxon_rank = c("species", "genus", "family", "order", "higher"),area_codes = NULL,synonyms = TRUE,render_report = FALSE,native = TRUE,introduced = TRUE,extinct = TRUE,location_doubtful = TRUE,hybrids = FALSE,infraspecies = TRUE,report_filename = NULL,report_dir = NULL,report_type = c("alphabetical", "taxonomic"),wcvp_names = NULL,wcvp_distributions = NULL
)
返回筛选数据后的数据集,如果 render_report=TRUE,还有一个HTML报告文件
使用synonyms参数可以只返回接受名。如果synonyms=TRUR,则废弃名、不合法名和其他非接受名都会返回(例如,清单并不限制名称:taxon_status==“Synonym”)。*rWCVP**提供两种清单类型:字母顺序型和分类顺序型。在字母顺序型清单中,所有名称都按照字母顺序排列,接受名加粗而异名接在接受名后。在分类顺序型清单中,名称按接受名分组,异名列在对应接受名下方。两种类型清单都包含命名人、参考文献和分布信息,注意科级标头仅在字母顺序清单中支持。
生成物种、属、科的空间分布对象*
wcvp_distribution(taxon,taxon_rank = c("species", "genus", "family", "order", "higher"),native = TRUE,introduced = TRUE,extinct = TRUE,location_doubtful = TRUE,wcvp_names = NULL,wcvp_distributions = NULL
)
包含分类单元范围多边形的简单特征 (sf) 数据框。
当taxon_rank指定高于物种阶元,那么返回整个组的分布区,而不是该组中单个物种的分布区。当改变选项时也适用,比如,不管native=TURE或native=FALSE,如果在原生分布区外有引入发现记录,也会包含紧取。要分辨原生分布区内的灭绝、引种或存疑记录,可以使用wcvp_summary和wcvp_occ_mat
绘制物种、属、科的分布地区
wcvp_distribution_map(range,crop_map = FALSE,native = TRUE,introduced = TRUE,extinct = TRUE,location_doubtful = TRUE
)
由ggplot2::ggplot绘制的分布区
世界植物 (POWO; /) 使用的配色方案镜像,其中绿色是原生的,紫色是引入的,红色是灭绝的,橙色是可疑的。有关如何使用自定义颜色的信息,请参见示例。
wcvp_distribution_map(wcvp_distribution("Callitris", taxon_rank = "genus"))
wcvp_distribution_map(wcvp_distribution("Callitris", taxon_rank = "genus"), crop_map = TRUE)
wcvp_distribution_map(wcvp_distribution("Callitris", taxon_rank = "genus")) +ggplot2::scale_fill_manual(values = c("red", "blue")) +ggplot2::scale_colour_manual(values = c("red", "blue"))
与 WCVP 完全匹配。名称与 WCVP 的精确匹配,可选择使用作者字符串来优化结果。
wcvp_match_exact(names_df, wcvp_names, name_col, author_col = NULL, id_col)
将WCVP中的结果与names_df中的原始数据进行匹配。
** wcvp_match_fuzzy(), wcvp_match_names()**
wcvp_names = rWCVPdata::wcvp_names
wcvp_match_exact(redlist_example, wcvp_names = wcvp_names, "scientificName", author_col = "authority", id_col = "assessmentId")
# A tibble: 20 × 16assessmentId scientificName redlistCategory authority match_type<dbl> <chr> <chr> <chr> <chr> 1 11081542 Antimima quart… Least Concern (Dinter)… NA 2 19395021 Avena hybrida Data Deficient Peterm. Exact (wi…3 64135503 Citrus garrawa… Least Concern F.M.Bail… NA 4 189601563 Croton campanu… Endangered Caruzo &… Exact (wi…5 115968141 Cynanchum free… Endangered (N.E.Br.… NA 6 11047751 Echinacanthus … Vulnerable H.S.Lo &… NA 7 11001316 Geissanthus pi… Endangered (Lundell… NA 8 126598076 Juglans pyrifo… Endangered Liebm. Exact (wi…9 198678856 Leichhardtia v… Vulnerable (Guillau… Exact (wi…
10 135836392 Mouriri myrtil… Least Concern (Sw.) Po… NA
11 146459149 Neocussonia um… Least Concern (Sond.) … Exact (wi…
12 170239556 Papuodendron l… Least Concern C.T.White Exact (wi…
13 68117888 Plerandra sp. … Endangered Lowry & … NA
14 133242195 Psammisia scle… Least Concern A.C. Sm. NA
15 580432 Rebutia albipe… Endangered Rausch NA
16 133163169 Senecio canesc… Least Concern (Bonpl.)… NA
17 185585004 Serruria colli… Endangered Salisb. … NA
18 8379911 Sesbania brevi… Least Concern J.B.Gill… NA
19 122659437 Trichilia demi… Critically End… D.Penn. NA
20 1433575 Vicia mollis Least Concern Boiss. &… NA
# ℹ 11 more variables: multiple_matches <lgl>,
# match_similarity <dbl>, match_edit_distance <dbl>,
# wcvp_id <dbl>, wcvp_name <chr>, wcvp_authors <chr>,
# wcvp_rank <chr>, wcvp_status <chr>, wcvp_homotypic <lgl>,
# wcvp_ipni_id <chr>, wcvp_accepted_id <dbl>
wcvp_match_exact(redlist_example, wcvp_names = wcvp_names, "scientificName", id_col = "assessmentId")
# A tibble: 23 × 16assessmentId scientificName redlistCategory authority match_type<dbl> <chr> <chr> <chr> <chr> 1 11081542 Antimima quart… Least Concern (Dinter)… NA 2 19395021 Avena hybrida Data Deficient Peterm. Exact (wi…3 64135503 Citrus garrawa… Least Concern F.M.Bail… NA 4 189601563 Croton campanu… Endangered Caruzo &… Exact (wi…5 115968141 Cynanchum free… Endangered (N.E.Br.… NA 6 11047751 Echinacanthus … Vulnerable H.S.Lo &… Exact (wi…7 11001316 Geissanthus pi… Endangered (Lundell… NA 8 126598076 Juglans pyrifo… Endangered Liebm. Exact (wi…9 126598076 Juglans pyrifo… Endangered Liebm. Exact (wi…
10 198678856 Leichhardtia v… Vulnerable (Guillau… Exact (wi…
# ℹ 13 more rows
# ℹ 11 more variables: multiple_matches <lgl>,
# match_similarity <dbl>, match_edit_distance <dbl>,
# wcvp_id <dbl>, wcvp_name <chr>, wcvp_authors <chr>,
# wcvp_rank <chr>, wcvp_status <chr>, wcvp_homotypic <lgl>,
# wcvp_ipni_id <chr>, wcvp_accepted_id <dbl>
# ℹ Use `print(n = ...)` to see more rows
在WCVP中模糊匹配。使用语法匹配和编辑距离对 WCVP 中的名称进行模糊匹配。
wcvp_match_fuzzy(names_df, wcvp_names, name_col, progress_bar = TRUE)phonetic_match(names_df, wcvp_names, name_col)edit_match(names_df, wcvp_names, name_col)
将WCVP中的结果与names_df中的原始数据进行匹配。
wcvp_match_fuzzy函数首先使用语法匹配,种后再基于编辑距离查找最接近匹配结果
语法匹配使用了phonics::metaphoe,最大可以处理20个字符长度。
编辑距离匹配根据Levenshtein相似性查找最接近的匹配,使用RecordLinkage::levenshteinSim计算。
wcvp_match_exact(), wcvp_match_names()
wcvp_match_fuzzy(redlist_example, wcvp_names = wcvp_names, "scientificName")
# A tibble: 23 × 16■■■■■■■■■■■■■■■ 80% | ETA: 4sassessmentId scientificName redlistCategory authority match_type<dbl> <chr> <chr> <chr> <chr> 1 19395021 Avena hybrida Data Deficient Peterm. Fuzzy (ph…2 64135503 Citrus garrawa… Least Concern F.M.Bail… Fuzzy (ph…3 189601563 Croton campanu… Endangered Caruzo &… Fuzzy (ph…4 115968141 Cynanchum free… Endangered (N.E.Br.… Fuzzy (ph…5 11047751 Echinacanthus … Vulnerable H.S.Lo &… Fuzzy (ph…6 126598076 Juglans pyrifo… Endangered Liebm. Fuzzy (ph…7 126598076 Juglans pyrifo… Endangered Liebm. Fuzzy (ph…8 198678856 Leichhardtia v… Vulnerable (Guillau… Fuzzy (ph…9 135836392 Mouriri myrtil… Least Concern (Sw.) Po… Fuzzy (ph…
10 146459149 Neocussonia um… Least Concern (Sond.) … Fuzzy (ph…
# ℹ 13 more rows
# ℹ 11 more variables: multiple_matches <lgl>,
# match_similarity <dbl>, match_edit_distance <dbl>,
# wcvp_id <dbl>, wcvp_name <chr>, wcvp_authors <chr>,
# wcvp_rank <chr>, wcvp_status <chr>, wcvp_homotypic <lgl>,
# wcvp_ipni_id <chr>, wcvp_accepted_id <dbl>
# ℹ Use `print(n = ...)` to see more rows
phonetic_match(redlist_example, wcvp_names = wcvp_names, "scientificName")
# A tibble: 24 × 16assessmentId scientificName redlistCategory authority match_type<dbl> <chr> <chr> <chr> <chr> 1 11081542 Antimima quart… Least Concern (Dinter)… NA 2 19395021 Avena hybrida Data Deficient Peterm. Fuzzy (ph…3 64135503 Citrus garrawa… Least Concern F.M.Bail… Fuzzy (ph…4 189601563 Croton campanu… Endangered Caruzo &… Fuzzy (ph…5 115968141 Cynanchum free… Endangered (N.E.Br.… Fuzzy (ph…6 11047751 Echinacanthus … Vulnerable H.S.Lo &… Fuzzy (ph…7 11001316 Geissanthus pi… Endangered (Lundell… NA 8 126598076 Juglans pyrifo… Endangered Liebm. Fuzzy (ph…9 126598076 Juglans pyrifo… Endangered Liebm. Fuzzy (ph…
10 198678856 Leichhardtia v… Vulnerable (Guillau… Fuzzy (ph…
# ℹ 14 more rows
# ℹ 11 more variables: multiple_matches <lgl>,
# match_similarity <dbl>, match_edit_distance <dbl>,
# wcvp_id <dbl>, wcvp_name <chr>, wcvp_authors <chr>,
# wcvp_rank <chr>, wcvp_status <chr>, wcvp_homotypic <lgl>,
# wcvp_ipni_id <chr>, wcvp_accepted_id <dbl>
# ℹ Use `print(n = ...)` to see more rows
edit_match(redlist_example, wcvp_names = wcvp_names, "scientificName")
# A tibble: 23 × 16■■■■■■■■■■■■■■■■■■■ 95% | ETA: 3sassessmentId scientificName redlistCategory authority match_type<dbl> <chr> <chr> <chr> <chr> 1 11081542 Antimima quart… Least Concern (Dinter)… Fuzzy (ed…2 19395021 Avena hybrida Data Deficient Peterm. Fuzzy (ed…3 64135503 Citrus garrawa… Least Concern F.M.Bail… Fuzzy (ed…4 189601563 Croton campanu… Endangered Caruzo &… Fuzzy (ed…5 115968141 Cynanchum free… Endangered (N.E.Br.… Fuzzy (ed…6 11047751 Echinacanthus … Vulnerable H.S.Lo &… Fuzzy (ed…7 11001316 Geissanthus pi… Endangered (Lundell… Fuzzy (ed…8 126598076 Juglans pyrifo… Endangered Liebm. Fuzzy (ed…9 126598076 Juglans pyrifo… Endangered Liebm. Fuzzy (ed…
10 198678856 Leichhardtia v… Vulnerable (Guillau… Fuzzy (ed…
# ℹ 13 more rows
# ℹ 11 more variables: multiple_matches <lgl>,
# match_similarity <dbl>, match_edit_distance <dbl>,
# wcvp_id <dbl>, wcvp_name <chr>, wcvp_authors <chr>,
# wcvp_rank <chr>, wcvp_status <chr>, wcvp_homotypic <lgl>,
# wcvp_ipni_id <chr>, wcvp_accepted_id <dbl>
# ℹ Use `print(n = ...)` to see more rows
在WCVP中匹配名称。将名称与 WCVP 匹配,首先使用精确匹配,然后对任何剩余的未匹配名称使用模糊匹配。
wcvp_match_names(names_df,wcvp_names = NULL,name_col = NULL,id_col = NULL,author_col = NULL,join_cols = NULL,fuzzy = TRUE,progress_bar = TRUE
)
将WCVP中的结果与names_df中的原始数据进行匹配。
一般来说,精确匹配只使用类群名称(name_col),除非提供了作者名(author_col)。
还可以通过join_cols来组建类群名称,但必须要确保它们的组建顺序正确(例如,c(“genus”, “species”, “infra_rank”, “infra”))。
模糊匹配使用语法和编辑距离匹配相结合,可以使用fuzzy=FALSE关闭模糊匹配。
wcvp_match_exact(), wcvp_match_fuzzy()
wcvp_match_names(redlist_example, wcvp_names, name_col = "scientificName", id_col = "assessmentId")
── Matching names to WCVP ──────────────────────────────────────────
ℹ Using the `scientificName` column
! No author information supplied - matching on taxon name only── Exact matching names ── ✔ Found 12 of names ── Fuzzy matching 8 names ── ✔ Found 7 of 8 names ── Matching complete! ── ✔ Matched 19 of 20 names
ℹ Exact (without author): 12
ℹ Fuzzy (edit distance): 4
ℹ Fuzzy (phonetic): 3
! Names with multiple matches: 3
# A tibble: 23 × 16■■■■■■■■■■■■■■■ 80% | ETA: 4sassessmentId scientificName redlistCategory authority match_type<dbl> <chr> <chr> <chr> <chr> 1 11081542 Antimima quart… Least Concern (Dinter)… Fuzzy (ed…2 19395021 Avena hybrida Data Deficient Peterm. Exact (wi…3 64135503 Citrus garrawa… Least Concern F.M.Bail… Fuzzy (ph…4 189601563 Croton campanu… Endangered Caruzo &… Exact (wi…5 115968141 Cynanchum free… Endangered (N.E.Br.… Fuzzy (ph…6 11047751 Echinacanthus … Vulnerable H.S.Lo &… Exact (wi…7 11001316 Geissanthus pi… Endangered (Lundell… Fuzzy (ed…8 126598076 Juglans pyrifo… Endangered Liebm. Exact (wi…9 126598076 Juglans pyrifo… Endangered Liebm. Exact (wi…
10 198678856 Leichhardtia v… Vulnerable (Guillau… Exact (wi…
# ℹ 13 more rows
# ℹ 11 more variables: multiple_matches <lgl>,
# match_similarity <dbl>, match_edit_distance <dbl>,
# wcvp_id <dbl>, wcvp_name <chr>, wcvp_authors <chr>,
# wcvp_rank <chr>, wcvp_status <chr>, wcvp_homotypic <lgl>,
# wcvp_ipni_id <chr>, wcvp_accepted_id <dbl>
# ℹ Use `print(n = ...)` to see more rows
生成类群和区域的发现记录矩阵
wcvp_occ_mat(taxon = NULL,taxon_rank = c("species", "genus", "family", "order", "higher"),area_codes = NULL,native = TRUE,introduced = TRUE,extinct = TRUE,location_doubtful = TRUE,wcvp_names = NULL,wcvp_distributions = NULL
)
含有taxon_name和plant_name_id的一个数据集
请参阅此处的示例,了解如何将此输出格式化以供发表。
wcvp_occ_mat(taxon = "Poa", taxon_rank = "genus",area = c("TAS","VIC","NSW"),introduced = FALSE)
# A tibble: 37 × 5plant_name_id taxon_name NSW TAS VIC<dbl> <chr> <dbl> <dbl> <dbl>1 435044 Poa affinis 1 0 12 469193 Poa amplexicaulis 0 0 13 435565 Poa cheelii 1 0 04 435598 Poa clelandii 0 1 15 435599 Poa clivicola 1 1 16 435658 Poa costiniana 1 1 17 435661 Poa crassicaudex 0 0 18 435797 Poa drummondiana 0 0 19 435841 Poa ensiformis 1 0 1
10 435878 Poa fawcettiae 1 1 1
# ℹ 27 more rows
# ℹ Use `print(n = ...)` to see more rows
WCVP本地版本的重新格式化
wcvp_reformat(wcvp_local, version = NULL)
返回相同结构的一个数据集
请注意,并非所有原始变量在重新格式化期间都会保留。例如,publication 在 v9 中是单个变量,但在数据包中拆分为多个变量。因此不可能简单地重命名这个变量。数据包中存在但 v9 中不存在的变量用 NA 填充。
从WCVP中生成一个概要表
wcvp_summary(taxon = NULL,taxon_rank = c("species", "genus", "family", "order", "higher"),area_codes = NULL,grouping_var = c("area_code_l3", "genus", "family", "order", "higher"),hybrids = FALSE,wcvp_names = NULL,wcvp_distributions = NULL
)
筛选后的数据集,或一个gt表格
分类阶元higher的可用值有 Angiosperms, Gymnosperms, Ferns and Lycophytes 。请注意,分组变量(如果是分类学的)应低于 taxon 和 taxon_rank 的级别,以生成有意义的摘要(即,按属、科或更高分类对属进行分组没有意义)。此外,如果分组变量是分类变量,则物种出现在整个输入区域。这意味着如果一个物种是任何输入区域的本地物种(即使它是在其他地区引入或灭绝的),它也被视为“本地”。同样,引入的事件优先于灭绝的事件。请注意,在此类汇总表中,“地方性”表示输入区域特有,不一定是输入区域内的单个 WGSRPD 第 3 级区域。
ferns = wcvp_summary("Ferns", "higher", get_wgsrpd3_codes("New Zealand"), grouping_var = "family")
wcvp_summary_gt(ferns)
ℹ Matches to input geography found at Country (Gallagher) and Region (Level 2)
ℹ Aggregating occurrence types across input area ("New Zealand") - see `?wcvp_summary()` for details.
Matching ■■■■■■■■■■■■■■■■■■■■■■■■■ 80% | ETA: 4s
从wcvp_summary结果中呈现摘要表
wcvp_summary_gt(x)
gt表格
见15. 例子
生物多样性信息标准 (TDWG) 记录植物分布的世界地理计划 (WGSRPD)。WGSRPD 3级的空间数据,用于绘制地图
wgsrpd3
一个包含20行和4个变量的“sf”对象:
geometry:sf几何
fillcol:用于映射
将 WGSRPD 地理映射到其他级别的数据。一个数据集,包含每个3级地区的地区(3级)、#'地区(2级)、大陆(1级)、国家(政治)和半球类别。
wgsrpd_mapping
一个包含370行和7个变量的数据集:
本文发布于:2024-01-30 22:12:40,感谢您对本站的认可!
本文链接:https://www.4u4v.net/it/170662396423191.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |