这个练习会使用SAPHANAExpressEdition的文本语义分析引擎对JSON格式的documents进行语义分析。 首先创建一个columntable,对其index开启fuzzytextsearch(模糊搜索)功能。 上述描述的操作可以用下面的SQL语句来完成: createcolumntablefoodanalysis(namenvarchar(64),descriptiontextFASTPREPROCESSONFUZZYSEARCHINDEXON); 其中description字段开启了模糊搜索功能。 将存储于名为docstore的documentstorecollection里的jsonkeyvalue键值对拷贝到刚刚创建的数据库表里: insertintofoodanalysiswithdocstoreas(,fromfoodcollection)selectdocstore。asname,docstore。 执行上述的sql语句,确保数据全部拷贝到数据库表foodanalysis中: 使用下列的sql语句对description字段进行模糊搜索: name,score()assimilarity,TOVARCHAR(description)fromfoodanalysiswherecontains(description,,fuzzy(0。5,))orderbysimilaritydesc 执行结果: HANAExpressEdition里的linguistic文本分析步骤也比较简单。 首先还是创建一个数据库表: createcolumntablefoodsentiment(namenvarchar(64)primarykey,descriptionnvarchar(2048)); 将documentstore里的json数据拷贝到数据库表里: insertintofoodsentimentwithdocstoreas(,fromfoodcollection)selectdocstore。asname,docstore。 针对description字段创建一个新的index: CREATEFULLTEXTINDEXFOODSENTIMENTINDEXONFOODSENTIMENT(DESCRIPTION)CONFIGURATIONGRAMMATICALROLEANALYSISLANGUAGEDETECTION(EN)SEARCHONLYOFFFASTPREPROCESSOFFTEXTMININGOFFTOKENSEPARATORSTEXTANALYSISON; 上述SQL语句会自动创建一个名为TAFOODSENTIMENTINDEX的文本分析表: 该表里的内容: 由此可以发现,之前我们导入到数据库表里的英文句子,被HANAtextengine拆解成单词,并且每个单词的词性也自动被HANA解析出来了。 要获取更多Jerry的原创文章,请关注公众号汪子熙: